我的显卡是V100,典型的服务器版本N卡,因为代码版本要求,准备安装CUDA 10.2版本。
安装显卡驱动
- autoinstall来安装(很好用)
1、首先查看系统推荐的显卡驱动:
ubuntu-drivers devices
2、如果系统还没有ubuntu-drivers工具,使用下面命令安装:
sudo apt-get install ubuntu-drivers
3、如果步骤1执行成功,则开始自动安装显卡驱动操作:
sudo ubuntu-drivers autoinstall
4、重启服务器
sudo reboot
5、输入命令查看是否安装成功:
nvidia-smi
如果显示以下界面,则安装成功。
安装CUDA
1、先下载目标版本的CUDA,先去官网
CUDA 10.2 安装命令如下:
添加版本图片
添加下载安装命令图片
添加cuda版本和驱动对应图片
2、执行完CUDA安装的操作后要将其添加到.bashrc文件里:
打开~/.bashrc
vim ~/.bashrc
在.bashrc文件组后添加
export CUDA_HOME=/usr/local/cuda
export PATH=$PATH:$CUDA_HOME/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-版本号/lib64
Note:这个版本号你可以进去usr/local下面,然后ls一下看看cuda版本是多少。
3、查看CUDA是否安装成功
nvcc -V
添加cuda成功图片
安装cudnn
- 如果没有nvidia账号,先注册一个,否则不能下载cudnn;
- 我使用deb文件安装的cudnn,也可以使用其他格式文件和安装方法;
1、先在下载目标版本cudnn包,先去官网,下载红框内的三个deb文件。
2、按照nvidia官方教程进行安装:
即下面三个命令(先runtime、再developer、最后doc):
sudo dpkg -i libcudnn8_x.x.x-1+cudax.x_amd64.deb
sudo dpkg -i libcudnn8-dev_8.x.x.x-1+cudax.x_amd64.deb
sudo dpkg -i libcudnn8-samples_8.x.x.x-1+cudax.x_amd64.deb
上述命令不要直接复制,注意更改成你下载文件的版本号。
3、测试cudnn是否安装成功
1)复制cuDNN samples到home目录下
cp -r /usr/src/cudnn_samples_v7 /$HOME
- 进入home目录
$ cd $HOME/cudnn_samples_v7/mnistCUDNN/
- 编译mnistCUDNN
$ sudo make clean
$ sudo make
4)编译过程中,可能报错,缺少包,先安装依赖后再重新编译:
sudo apt-get install libfreeimage3 libfreeimage-dev
5)运行mnistCUDNN
$ sudo ./mnistCUDNN
运行需要一段时间,如果出现 “Test passed!” 表明cuDNN已安装成功。在运行过程中可以再开一个终端,使用nvidia-smi
命令查看显卡是否占用,确定全部环境是否安装成功。
报错处理
安装好cudnn后发现显卡驱动丢了,使用nvidia-smi
命令后报错:
Failed to initialize NVML: Driver/library version mismatch
安装gpustat也显示找不到gpu,且cuda,深度学习gpu均不行,试了各种方法,包括检查内核等,最后发现还是文章开头的方法最好用。
1、卸载原来的驱动:
sudo apt-get purge nvidia*
2.查找可用的驱动版本(其实也可以不用做这一步)
ubuntu-drivers devices
添加可用驱动图片
3、开始自动安装显卡驱动操作:
sudo ubuntu-drivers autoinstall
4、重启服务器
sudo reboot
5、输入命令查看是否安装成功:
nvidia-smi
这样操作后就可以了,而且cudnn的样例也运行成功!