环境配置
----------------------------------------
deepin 15.7
cuda9
python 3.6
pytorch 1.0.1
----------------------------------------
安装显卡:
#nvidia-smi 查看显卡状态
发现没有安装闭源驱动
#apt-get install nvidia-smi
直接带一串把nvidia的驱动全部装完 版本号是390.67
安装cuda
下载cuda9.0 不建议下9.1或者9.2 如果你要用tensorflow的话。因为pip包安装的tensorflow默认支持的是大版本,除非你打算编译安装,然后自己选择cuda版本。
https://developer.nvidia.com/cuda-90-download-archive
选择linux-x86_64-ubuntu-16.04-runfile
不要手贱,ubuntu的deb deepin是用不了的
安装前先保证gcc和g++版本对应cuda,我的是cuda9.0,官方文档要求gcc/g++ 5.x,
先对gcc/g++降级,参考这个https://{BANNED}ceres.comblogs.com/in4ight/p/6626708.html
sudo apt-get install gcc-5
sudo apt-get install g++-5
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 100 //gcc具体目录自己用which gcc查
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 100
安装sudo ./cuda_9.0.176_384.81_linux.run --tmpdir /xxx选择不要装显卡驱动,就是nvidia accelerate driver那个,只要装cuda toolkit和sample 带tmpdir参数,可以帮助你避免根目录空间不足的烦恼
以上两步到位cuda就到位了。安装结束会有警告,那是当然他认为你没有装驱动嘛,如果缺包就apt补一下
验证cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuerysudo make./deviceQuery
有PASS则表示成功
然后修改环境变量,pytorch和tensorflow调用cuda的时候需要找到这些lib
gedit ~/.bashrc末尾添加
#cuda
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64/:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-9.0/bin:$PATH
具体位置根据自己安装路径修改