上一节内容我们成功将Rstudio Server镜像运行起来,这一节让我们把docker镜像打造成可实际使用的工具。
docker镜像运行中的关键参数
目录映射
-v
docker容器内,事实上是个完整的linux系统。这个系统共享宿主机内核,但其上层却是和宿主机隔离的,因而docker内部可以随意折腾,而不必担心把宿主机的系统弄崩溃。
上一节,我们成功开启了docker容器,但是通过网页进入Rstudio后,发现里边无法找到我们所需要的文件!若需要用这个Rstudio处理宿主机上的数据,我们需要将宿主机上的路径映射如容器内。通过-v
参数实现,命令格式-v outDir:inDir
,outDir
为宿主机的路径,inDir
为docker容器内映射的路径,两者都需要写绝对路径!实际运行的命令示例如下:
docker run -p 8787:8787 -e PASSWORD=yourpasswordhere \
-v /mnt/public:/home/rstudio/public_data \
rocker/rstudio
此时,再通过网页登录Rstudio,会在/home/rstudio/public_data
中看到主机上/mnt/public
目录下的文件。我们可以通过多个-v
参数,往容器中挂载多个路径。
端口映射
-p
-p
参数将容器内部的端口映射到宿主机上,以便容器能够能够对外提供服务或者方便外部访问宿主机。命令格式-p outPort:inPort
,outPort
为映射出的宿主机端口,inPort
为容器内部端口。Rstudio容器有下面几个重要端口:
-
8787
: Rstudio对外服务端口,不解释 -
3838
: Shiny Apps对外服务端口。Rstudio Server的docker镜像也可以作为Shiny服务器打开 -
6311
: Rserve 对外服务端口。安装并启动Rserve
包,则容器可以成为R服务器,为其他诸如C++/Java/PHP/Python/Ruby/Nodejs等提供远程后台服务
上述端口可以通过Rstudio Server以及相应配置文件进行自定义,这里不赘述。
若宿主机同时运行多个镜像,切记多个镜像间,端口不要冲突! 例如,某个正在运行的Rstudio容器,已经占据了8787端口,那么新启动的Rstudio容器,需要避开这个端口,例如将端口设置为-p otherPort:8787
等,否则容器启动时会有相关报错信息提示。
环境变量
-e
相同的镜像可以构建成为不同的容器,通过定义容器内部环境变量是常用的手段。使用-e
参数定义容器内部环境变量,命令格式:-e ANYENV=xxxxxx
。多个环境变量通过多个-e
参数实现。Rstudio server中可定义的常用环境变量如下:
-
PASSWORD
:Rstudio Server登录密码,变量值可随意指定,这个必须设置! -
ROOT
:Rstudio用户可否使用sudo?若设定-e ROOT=true
则Rstudio用户可通过sudo在容器内行使root权限。 -
USER
:Rstudio用户名,默认为rstudio,可以自定义 -
USERID
/GROUPID
:用户和用户组ID。普通用户登录到宿主机上,在命令行中输入id
然后回车,可直接查看自己的用户ID(uid)和用户组ID(gid)。俩变量默认值都是1000。这俩环境变量,连同上面的USER
,在建立容器的时候强烈建议设置成与宿主机上自己用户一致,以便容器内外文件访问与读写权限统一。 -
ADD
:若设定-e ADD=shiny
,则容器会同时成为shiny应用服务器(若使用这个shiny服务器,还需要映射3838端口)。
上述环境变量,以及更多环境变量的作用和设置,直接看Rstudio Server镜像的代码userconf.sh和add_shiny.sh,代码写的比Mannual清晰明确的多!
使用docker-compose建立镜像
上面介绍了几个重要参数,那么我们可以写一个长长的命令,来构建我们的Rstudio容器:
docker run --name myRstudio -d --restart always\
-p 8787:8787 \
-p 3838:3838 \
-e USER=user \
-e PASSWORD=passwd \
-e USERID=1000 \
-e GROUPID=1000 \
-e ADD=shiny \
-v /mnt/public:/home/rstudio/public_data \
-v /home/user/R_workdir:/home/user/R_workdir \
rocker/rstudio:3.6.1
根据需要,这个命令行仍然可以继续延伸下去。。。
docker-compose方便了我们设置多个容器参数(它的意义绝不限于此!),于是我们新建一个yaml格式的配置文件myRstudio.yaml
,内容如下:
version: "3" # xml版本
services:
rstudio:
restart: always
image: rocker/rstudio:3.6.1
environment:
- PASSWORD =passwd # PASSWD
- USER =user # 指定用户名
- WKUID=1000 # 指定用户ID, 默认是1000
- WKGID=1000 # 指定用户GROUPID,默认是1000 , 这个和WKUID设置成和宿主一致可以搞
ports: # 端口映射,右边是container里的端口,左边是实际端口
- 8787:8787
- 3838: 3838
volumes: # 位置映射,右docker内部,左实际
- /mnt/public:/home/rstudio/public_data
- /home/user/R_workdir:/home/user/R_workdir
container_name: myRstudio
然后,运行下面的命令启动Rstudio容器:
docker-compose -f myRstudio.yaml up -d