之前自己的电脑里安装的CUDA是10.1.243版本的。因为是刚接触Ubuntu20.04嘛,能安装就安装了,没想太多。在软件和更新的附加驱动里,选择的NVIDIA Comporition设备使用备选的驱动是NVIDIA Server Driver metapackage的450-server(专有),不过可惜的是,在后续使用就凸显出问题了。比如安装出cudnn的问题。
想着安装CUDA10.2版本,可是去英伟达官方一看,人家居然不支持Ubuntu20.04版。得了。于是就想着升级CUDA到11版本。这个首先需要去软件和更新里,选择X.Org X server - Nouveau display driver的开源版本。此时你nvcc -V命令已经显示不存在目录了。
然后就是去英伟达官方找到对应版本的CUDA。按照官方网站的提示,找到CUDA Toolki11.0 update版本。然后选择自己的系统和版本。这里就有Ubuntu20.04了。
之后就是终端输入命令用wget下载,并用sudo sh cuda_11.0.3_450.51.06_linux.run安装脚本。此时会顺利出现这样的界面,输入接受accept就可以了。
如果顺利的话,如同网上介绍的,接下来就会提示成功安装。不过,机智客这里却有点小坎坷。这里提示安装失败,具体要看log文件里的细节。这里显示的是我们的驱动没有安装。如图所示。
奇怪!当然不是奇怪驱动没有安装,毕竟我们之前设置了,而是说,这里出现了多次安装脚本失败的问题,不管附加驱动里设置的是开源版还是英伟达版。看网上说明也没有个所以然来,纳闷。
后来反应过来,需要在安装的过程中将第一个驱动选项删除掉,而后面cuda几个选项都默认保留。这才完成。之后等待安装成功以后,就需要配置环境变量了。在命令行下用文本编辑工具,机智客这里用的是nano。这里既然安装了cuda11.0那么配置环境命令就是:nano
~/.bashrc打开输入两个命令:export PATH=/usr/local/cuda-11.0/bin${PATH:+:${PATH}}和export LD_LIBRARY_PATH=/usr/local/cuda-11.0/lib64${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}之后再查询nvcc -V就能看到当前安装的是V11.0.221版本的cuda了。
去英伟达官网下载cuDNN,在cudnn页面有下载按钮,不过点进去的话,会提示需要注册或登录官方网站的。所以你需要注册一个账号,之前有就太好了。打开官方网站后,会提示你提交一个你使用技术框架的表单。比如你用什么人工智能深度学习库之类的。提交表格后,此时才真正进入cuDNN
Download页面。此时同意cuDNN软件许可协议。此时会出现三个超链接,两个是CNDNN v8.2.0版本的面向不同CUDA版本的下载链接。
由于我们之前安装过CUDA,而且这次还通过重新安装更新版本到11.0版本。前面通过终端命令nvcc -V也查看过Ubuntu系统里CUDA了。之前默认没有10.1版的库,现在我们更新到了11.0版本,所以直接点击第一个超链接也就是Download cuDNN v8.2.0 (April 23rd, 2021), for CUDA11.x就行。接下来的步骤就是网上很多教程都介绍过的。无非就是用命令行拷贝从网上下载下来的文件。然后设置权限。