1 GPU驱动的安装
直接使用ubuntu自带的 软件和更新 软件来安装就好,点附加驱动,找到NVIDA
(或者安装cuda时也可以安装)
貌似目前conda在安装pytorch时会自动帮你安装cuda,cudnn,nvcc好像一般用不到。所以不用单独安装他们,也就是说安装完驱动,然后nvidia-smi查看最高支持的cuda版本就好了。
2 cuda的安装
首先查看当前驱动可支持的CUDA版本
https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html
或者直接nvidia-smi查看最高支持的cuda版本。
然后下载相应版本的CUDA
官网https://developer.nvidia.com/cuda-toolkit-archive
找到cuda10.0,点进去
这里选择runfile方式安装,deb安装容易出错
1)分别把第一个主文件和下面的补丁下载下来,在下载的文件夹处打开终端,输入以下命令进行安装(如果安装失败尝试deb文件安装的方法)
sudo sh cuda_10.0.130_410.48_linux.run
sudo sh cuda_10.0.130_410.48_linux.run为该文件名,看情况为定
注:如果没有gcc和g++则需要先安装
sudo apt-get install gcc
sudo apt-get install g++
如果安装CUDA 9.0则需要制定版本的gcc,g++。cuda9.0仅支持GCC 6.0及以下版本,而Ubuntu 18.04预装GCC版本为7.3,
故手动进行降级:(忽略)
sudo apt-get install gcc-4.8
sudo apt-get install g++-4.8
接着按下面的步骤选择:
一路回车
accept
n(不要安装driver,已有驱动)
y
y
y
2)安装完成后,设置环境变量。
打开主目录下的 .bashrc文件添加如下路径,例如我的.bashrc文件在/home/wangyuanwei下,如果没有找到,则按Ctrl+H键显示隐藏文件。
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-10.0/lib64
export PATH=$PATH:/usr/local/cuda-10.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-10.0
终端运行:source ~/.bashrc
检查:nvcc --version,如果显示下面的文子就说明安装成功了。
3.cudnn的安装
官网https://developer.nvidia.com/rdp/cudnn-archive
这里选cuDNN Library for Linux(Deb安装容易出错)
下载下来,解压下载的文件,可以看到cuda文件夹,在当前目录打开终端,执行如下命令:(也就是把下载的cudnn文件复制到相应的cuda文件中去)
sudo cp cuda/include/cudnn.h /usr/local/cuda/include/
sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64/
sudo chmod a+r /usr/local/cuda/include/cudnn.h
sudo chmod a+r /usr/local/cuda/lib64/libcudnn*
新版本cudnn加上,用于查版本信息
sudo cp cuda/include/cudnn_version.h /usr/local/cuda/include/
或直接
sudo cp ./* /usr/local/cuda/lib64
安装完成
3)查看cudnn版本
在终端输入
cat /usr/local/cuda/include/cudnn.h | grep CUDNN_MAJOR -A 2
新版本为以下命令
cat /usr/local/cuda/include/cudnn_version.h | grep CUDNN_MAJOR -A 2
如果出现下图所示版本信息,说明安装成功。
4.安装NCCL
下载地址https://developer.nvidia.com/nccl/nccl-download
找到对应版本下载,ubuntu可以直接安装
卸载CUDA
卸载CUDA很简单,一条命令就可以了,主要执行的是CUDA自带的卸载脚本,读者要根据自己的cuda版本找到卸载脚本:
sudo /usr/local/cuda-10.0/bin/uninstall_cuda_10.0.pl
或
Installation Guide Linux :: CUDA Toolkit Documentation (nvidia.com)
sudo apt-get --purge remove "*cublas*" "*cufft*" "*curand*" \
"*cusolver*" "*cusparse*" "*npp*" "*nvjpeg*" "cuda*" "nsight*"
卸载之后,还有一些残留的文件夹,之前安装的是CUDA 10.0。可以一并删除:
sudo rm -rf /usr/local/cuda-10.0/
Ubuntu18.04问题——N: 无法安全地用该源进行更新,所以默认禁用该源。
打开软件软件和更新(不是换源)
然后点击其它软件
里边有一个网址与你报错的网址一样,而且是勾选状态的
取消选择,然后关闭
参考资料
https://blog.csdn.net/wanzhen4330/article/details/81699769
https://blog.csdn.net/u010801439/article/details/80483036
https://www.cnblogs.com/carle-09/p/12373013.html
(17条消息) Ubuntu18.04问题——N: 无法安全地用该源进行更新,所以默认禁用该源。_qq494370的博客-CSDN博客