2022-06-15 docker 使用gpu

背景

我想在docker中部署深度学习的模型，而且服务器的环境无法联网。深度学习框架需要使用gpu，但是docker 只能使用 cpu，没有挂载gpu。

我在网上查到 docker run 启动容器的时候，加上 --gpu可使用gpu。我测试后发现报错

docker run -v $(pwd):/workspace/data --gpus all -it voidful/wav2vec-u:1.0.0 bash
#报了下面的错误
could not select device driver "" with capabilities: [[gpu]].
ERRO[0000] error waiting for container: context canceled

搜索之后发现，docker需要添加nvidia相关工具包

1. docker 使用nvidia工具包分类

docker所需nvidia工具包分类
参考：将nvidia添加到runtime

要使docker容器能调用本地的gpu,有三种方法：

一是，安装nvidia-docker，该方法已被官方舍弃
地址为https://github.com/NVIDIA/nvidia-docker#upgrading-with-nvidia-docker2-deprecated

二是，安装nvidia-container-toolkit，又名nvidia-docker2，后添加—gpus参数来使用
安装：
https://github.com/NVIDIA/nvidia-docker#ubuntu-16041804-debian-jessiestretchbuster
使用：
https://github.com/NVIDIA/nvidia-docker#usage

三是，安装nvidia-container-runtime，在首次运行时添加—runtime=nvidia参数，后续启动、结束都不需要再加。【推荐】

优点：docker19.03之后，不再需要安装nvidia-docker了。只安装NVIDIA-CONTAINER-RUNTIME就可以使用了，并且支持docker-compose。
官方地址为：https://nvidia.github.io/nvidia-container-runtime/

2. 探索安装

参考：docker19使用GPU
centos 7 安装nvidia-container-runtime

下载GPU的驱动
在NVIDIA驱动程序页面下载对应的驱动。

安装NVIDIA-CONTAINER-RUNTIME
在https://nvidia.github.io/nvidia-container-runtime/查看支持的操作系统和版本，并根据对应选项，添加源，因为我是centos7，所以添加方式为：

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo

然后直接yum install 就可以了

sudo yum install nvidia-container-runtime

进行测试，如果出现显卡信息就可以了

docker run -it --rm --gpus all centos nvidia-smi

3. 解决服务器无法联网的问题

1.磨刀砍柴

严格模式：两台同样配置，同样环境的服务器、例如：gcc cuda cmake版本等都完全相同
简单模式：两台安装了相同版本系统的服务器，例如我的两台都是centos 7

这里我使用了简单模式，因为复杂模式太过复杂

我的一台为实验室服务器（目标机）一台为租用的腾讯云（借用机）

2.借鸡生蛋

以下操作在腾讯云（借用机）中执行：
添加源 repo

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)
curl -s -L https://nvidia.github.io/nvidia-container-runtime/$distribution/nvidia-container-runtime.repo | \
sudo tee /etc/yum.repos.d/nvidia-container-runtime.repo

接下来需要从源去下载rpm包，但不进行安装
参考：yum 下载全量依赖 rpm 包及离线安装（终极解决方案）

所以下载nvidia软件包全部依赖

#yum deplist 包名
yum deplist nvidia-container-runtime
#展示包的全部依赖

sudo yum -y install yum-utils
#安装 yum-utils
mkdir ~/software_packages
cd ~/software_packages
repotrack nvidia-container-runtime
#此时会将软件的所有依赖包下载到 ~/software_packages

这时候将 ~/software_packages 下的文件打包下载

cd ~
tar -zcvf software_packages.tar.gz ~/software_packages

3.斗转星移

此时，登录实验室服务器（目标机），上传刚刚打包的文件，进行解压

rz
tar -zxvf software_packages.tar.gz ~/software_packages

进入解压的目录离线安装，一定要选择采用 *.rpm的方式，会自动解决依赖

cd ~/software_packages
# 离线安装
$ rpm -Uvh --force --nodeps *.rpm

4. 启动docker 容器

docker run -v $(pwd):/workspace/data --gpus all \
-it voidful/wav2vec-u:1.0.0 bash
#成功启动container
#进入container后输入，nvidia-smi
nvidia-smi
#成功显示显卡信息

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 225,641评论 6赞 525
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 96,754评论 3赞 408
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 173,075评论 0赞 370
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 61,369评论 1赞 303
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 70,386评论 6赞 402
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 53,800评论 1赞 317
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 42,122评论 3赞 431
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 41,130评论 0赞 281
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 47,689评论 1赞 327
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 39,693评论 3赞 348
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 41,804评论 1赞 356
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 37,399评论 5赞 351
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 43,128评论 3赞 341
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 33,528评论 0赞 25
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 34,705评论 1赞 278
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 50,409评论 3赞 383
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 46,878评论 2赞 368

2022-06-15 docker 使用gpu

背景

1. docker 使用nvidia工具包分类

2. 探索安装

3. 解决服务器无法联网的问题

4. 启动docker 容器

推荐阅读更多精彩内容