1. cuda下载
以11.3为例:
2. cuda安装
wget https://developer.download.nvidia.com/compute/cuda/11.3.1/local_installers/cuda_11.3.1_465.19.01_linux.run
# 给脚本权限
chmod +x cuda_10.1.105_418.39_linux.run
# 运行脚本
./cuda_10.1.105_418.39_linux.run --override
安装的时候注意只用选Toolkit就可以,其他的应该不用装,注意不要选软连接。
此时输入cd /usr/local,可以看到刚装的11.3了。
3. cuda环境变量配置
# 首先打开环境配置文件
sudo gedit ~/.bashrc
# 在文档的末尾添加这三行,cuda-11.3的地方修改为自己新安装的cuda版本
export CUDA_HOME=/usr/local/cuda-11.3
export LD_LIBRARY_PATH=/usr/local/cuda-11.3/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-11.3/bin:$PATH
# 生效
source ~/.bashrc
4. 配套cuDnn
找到对应cuDnn并下载:
本文选择的是cuDnn 8.2.1 for cuda 11.x,只用下载cuDNN Library for Linux (x86_64)就够了。
下载好后是一个tgz的压缩文件,先解压缩,然后参照下边的代码将对应文件复制到cuda11.3的文件夹中即可。
tar -zvxf cudnn-10.1-linux-ppc64le-v8.0.5.39.tgz
sudo chmod 777 -R *
sudo cp cuda/include/cudnn.h /usr/local/cuda-11.3/include
sudo cp cuda/lib64/libcudnn* /usr/local/cuda-11.3/lib64
总结
如需其他版本cuda环境,只需重复上述步骤,然后修改~/.bashrc中cuda版本,然后source生效即可。
本人在服务器上重复上述操作遇到过版本切换失败的情况,此时关闭终端,重新ssh连接一下即可。