详解 Docker 中 Image、Container 与 Volume 的迁移
已经部署的容器化服务,也不是不需要维护的。而且,由于生产环境往往有这样那样的严格要求,往往需要些非常规操作。Image(镜像)、Container(容器)和 Volume(数据卷)的迁移,就是一类有用的非常规操作。
以下镜像,均以最简单的 Alpine 为例。
Image
镜像的迁移,适用于离线环境。
一般离线环境,都会自建 Docker Registry。无论官方的,还是最近流行的 Harbor,都是不错的选择。但是,这个世界上就是有些环境,或者说一些环境在某些时期,没有外网,也没有内部的 Registry。这个时候要部署 Docker 的服务,怎么办?
只能通过镜像的迁移。实际上,Harbor 的 offline installer,就是采用这种形式。
Save
|
1
2
3
4
5
|
use stdout
docker save alpine > /tmp/alpine.tar
or write to a file directly
docker save alpine -o /tmp/alpine.tar
|
推荐使用 -o 的形式,因为利用 stdout 的做法虽然直观,但在某些场景下无效,比如利用 ssh 远程执行命令。
Load
|
1
2
3
4
5
|
use stdout
docker load < /tmp/wekan.tar
or read from a file directly
docker load -i /tmp/wekan.tar
|
Container
容器的迁移,适用于已经上线,且状态复杂、从零开始启动不能正常工作的服务。容器迁移的包,包含了镜像。
Export
先准备一个正在运行的服务,并且弄脏环境。
|
1
2
3
4
5
6
7
|
$ docker run –rm -d –name test alpine tail -f /dev/null
9232f0c1dafe0f29918f281ca37bb41914677e818cb6f252abf3dab3be04fbb2
$ docker exec test touch proof
$ docker exec test ls -hl proof
-rw-r–r– 1 root root 0 Nov 20 14:33 proof
#执行导出操作:docker export test -o test.tar
|
Import
首先,关闭刚才运行的服务。
|
1
2
3
4
5
6
7
|
$ docker kill test
test
#执行导入操作:
$ docker import test.tar test-img
sha256:e03727eeba7e16dd3acfcc7536f1244762508f9b6b9856e49cc837c1b7ffa444
|
要注意的是,import 后得到的是一个镜像,相当于是执行了 docker commit 后的内容。当然,docker commit 不是一个推荐的操作,所以容器的导入、导出,就显得不是那么的顺眼。
最后,检查之前创建的文件。
|
1
2
3
4
5
6
|
$ docker run –rm -d –name test test-img tail -f /dev/null
ee29cb63bb2d3ed8ac890789ba80c4fe4078b9d5343a8952b6217d64b4dcbe23
$ docker exec test ls -hl proof
-rw-r–r– 1 root root 0 Nov 20 14:33 proof
|
可以看到,前面创建的文件是存在的,并且时间戳完全一致。
Volume
数据卷的迁移,比较麻烦。Docker 并未提供官方的简单方案。
当然,直接用 root 用户访问文件系统的 Docker 数据,比如默认的 /var/lib/docker/volumes/ 下的文件夹,直接进行打包操作,也不是不行。但这毫无疑问是最糟糕的方案。
目前参考《Use volumes | Docker Documentation》,找到的最佳方案是,用另一个容器,把数据卷内容打包,并且通过挂载的形式传递到宿主机。
Backup
首先,准备一个 Volume。
|
1
2
3
4
5
6
7
|
$ docker run –rm -d –name test -v test-vol:/data test-img tail -f /dev/null
f4ff81f4c31025ff476fbebc2c779a915b43ba5940b5bcc42e3ef9b1379eaeab
$ docker exec test touch /data/proof
$ docker exec test ls -hl proof
-rw-r–r– 1 root root 0 Nov 20 14:40 proof
|
执行备份操作:
|
1
2
3
4
5
|
$ docker run –rm -v test-vol:/volume -v
$PWD:/backup alpine tar cvf /backup/backup.tar volume
volume/
volume/proof
|
直接在已运行容器中打包,然后通过 docker cp 复制出来,也是一个方案。但这会对正在运行的容器有影响,不建议在真正重要的容器中使用。
这里利用了一个 Alpine 镜像来执行操作。实际上,任何一个自带 tar 的镜像都是可以的。
Restore
首先,清理刚才的容器和数据卷。
|
1
2
3
|
$ docker kill testtest
$ docker volume rm test-voltest-vol
|
执行还原操作:
|
1
2
3
|
docker run –rm -v test-vol:/volume -v
$PWD:/backup alpine tar xf /backup/backup.tar
|
最后,检查还原后的结果。
|
1
2
3
4
5
6
|
$ docker run –rm -v test-vol:/data alpine ls -ahl /data
total 8
drwxr-xr-x 2 root root 4.0K Nov 20 14:48 .
drwxr-xr-x 1 root root 4.0K Nov 20 14:50 ..
-rw-r–r– 1 root root 0 Nov 20 14:40 proof
|
结论
以上三招六式,其实都不是常规手段。
Image 的传递,更应该依赖于内部 Docker Registry 而非 tar。(当然,也有例外,比如集群部署大镜像的 P2P 方案,也许可以借鉴这个手段。)
Container 的状态,应该是可弃的。一个运行了很长时间的 Container,应该是可以 restart、甚至 kill 后再重新 run 也不影响既有功能的。任何有依赖的状态,都应该考虑持久化、网络化,而不能单纯地保存在本地文件系统中。
Volume 的手动迁移,的确可以采用上述方式。但是,Volume 需要手动迁移、备份吗?这需要专业而完善的插件来实现。