安装驱动
-
打开软件与更新
-
查看驱动
切忌最后一个开源驱动不要选择(其他按版本关系来)
3.卸载原有的开源驱动(如果你打开附加驱动,显示的最后一个,推荐操作)
#打开黑名单:
sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
#添加两行语句:
blacklist nouveau
options nouveau modeset=0
#更新initramfs
sudo update-initramfs -u
#重启
reboot
#验证,终端输入语句,
lsmod | grep nouveau
#如果没有结果表示禁用成功。
- TensorFlow版本
网上有很多要求下载指定版本的CUDA toolkit、 cuDNN ,根据的 不同TensorFlow 对应的版本不同
- 你也可以自己点击链接进去看看
- 宝藏博客,给了所有版本的下载地址,开始没发现
- 但是我在网上找不到我的显卡GTX970M对应的东西了(5年前的笔记本上的显卡),所以我直接在conda上安装TensorFlow-GPU版本(没办法了)。抱着试一试的心态。
conda install tensorflow-gpu==1.15
- 然后
conda list
你会发现cuda cuDNN已经安装好了 只不过版本较高
接下来跑了个程序
发现GPU没有变化仍然是使用CPU训练(也有可能直接成功,如果你的驱动版本对的话)
- 查看驱动版本
由上图可见我的版本是**nvdia-driver-460 **版号就是460 这个很重要
CUDA版本的选择:它依赖于显卡的驱动程序版本,如下表,参考官方文档。与下表进行对照选择兼容的CUDA版本。
- 选择合适版本的驱动
conda list
- 我的cuda 版本为10 所以要求 显卡驱动>=410
- 直接在软件与更新更改驱动版本为460后 gpu运行成功 而且不需要对cuda cuDNN这些版本进行改变
运行速度快很多了,虽然显卡很一般但也比原来好多了。希望大家也能一次成功。
附录
- 查看GPU使用情况
#静态显示GPU信息
nvidia-smi
#配合watch命令, 让一秒刷新一次
watch -n 1 nvidia-smi
- 安装ipdb
#输入
conda install -c conda-forge ipdb
#如果不行就用
pip install ipdb