问题:我们通过docker下载centos的大小仅仅在200M左右,但下载一个tomcat就需要500M以上!这看着就很不合理。因为在window上通过虚拟机安装一个centos大概需要4G以上,而下载最新的tomcat9也不超过20M。
抛除centos的各种硬件模拟,因为docker不需要Hypervisor实现硬件资源虚拟化,centos的问题似乎可以得到解释。但tomcat可没办法解释了,20M到500M的变化。
在查看相关资料后,为了说明这个问题,还是要解释docker的镜像到底是怎么生成的。
(UnionFS)文件联合系统
UnionFS(联合文件系统):Union文件系统(UnionFS)是一种分层、轻量级并且高性能的文件系统,它支持对文件系统的修改作为一次提交来一层层的叠加,同时可以将不同目录挂载到同一个虚拟文件系统下(unite several directories into a single virtual filesystem)。Union 文件系统是 Docker 镜像的基础。镜像可以通过分层来进行继承,基于基础镜像(没有父镜像),可以制作各种具体的应用镜像。
特性:一次同时加载多个文件系统,但从外面看起来,只能看到一个文件系统,联合加载会把各层文件系统叠加起来,这样最终的文件系统会包含所有底层的文件和目录。就像是花卷一样,一层套一层,但能看到的只有最外面那一层。
Docker镜像加载原理
docker的镜像实际上由一层一层的文件系统组成,这种层级的文件系统UnionFS。
bootfs(boot file system)主要包含bootloader和kernel, bootloader主要是引导加载kernel, Linux刚启动时会加载bootfs文件系统,在Docker镜像的最底层是bootfs。这一层与我们典型的Linux/Unix系统是一样的,包含boot加载器和内核。当boot加载完成之后整个内核就都在内存中了,此时内存的使用权已由bootfs转交给内核,此时系统也会卸载bootfs。
rootfs (root file system) ,在bootfs之上。包含的就是典型 Linux 系统中的 /dev, /proc, /bin, /etc 等标准目录和文件。rootfs就是各种不同的操作系统发行版,比如Ubuntu,Centos等等。
那为什么centos的镜像只有200M?
对于一个精简的OS,rootfs可以很小,只需要包括最基本的命令、工具和程序库就可以了,因为底层直接用Host的kernel,自己只需要提供 rootfs 就行了。由此可见对于不同的linux发行版, bootfs基本是一致的, rootfs会有差别, 因此不同的发行版可以公用bootfs。
也就是说,安装一个centos镜像,只要下载一个kernel(linux核心)+centos rootfs(centos的命令行),下载一个ubuntu,也只是下载一个kernel(linux核心)+rootfs(ubuntu的命令行)。
下载最新版centos
我们注意到只有一个complete
这个下载完成的就是centos的rootfs
而如果我们下载其他的比如mongo
这里下载会有很多的complete,是因为mongo要依赖很多东西,一层套一层,最终才能运行起来。
回到我们的问题,为什么tomcat这么大?
因为tomcat运行至少需要3层铺垫。第一层os内核,也就是我们的kernel,第二层centos
,第三层jdk,最外层才是我们的tomcat。
docker镜像采用这种技术有什么好处?
最大的一个好处就是 - 共享资源
比如:有多个镜像都从相同的 base 镜像构建而来,那么宿主机只需在磁盘上保存一份base镜像,同时内存中也只需加载一份 base 镜像,就可以为所有容器服务了。而且镜像的每一层都可以被共享。
docker镜像这种分层结构有什么特点
docker镜像都是只读的,当容器启动时,一个新的可写层被加载到镜像顶部。这一层通常称为“容器层”,而容器层下面的都是镜像层。
commit(将自定义的镜像提交到本地)
类似于git commit嘛,没啥好说的。比如我们运行了一个mysql容器,通过navicat连接向mysql中建表,填数据,我们想把这个镜像保存了,提供给其他人使用,这样其他人拿到镜像的时候就已经有已经写好的表和数据了。
docker commit -m "提交你的描述信息" -a="作者" 容器id 要创建的目标镜像名:[标签名(版本号)]
至于怎么push到远程仓库,之后再写。