1. 记得装desktop版本的ubuntu,否则没有xserver,比较蛋疼
2. 安装英伟达显卡驱动,要关掉x server……
默认进入命令行启动
http://blog.topspeedsnail.com/archives/4922
注意16.04用这句:
$sudo systemctl set-default multi-user.target
这是每次开机默认进入命令行模式的方法。单词关闭用
sudo /etc/init.d/lightdm stop
然后遇到了坑爹的linux预装驱动……需要关掉。(谁说ubuntu少折腾来着……)
驱动安装过程这个链接内容比较详细(卸载系统驱动后机器无法完全启动,但是ssh没问题)
http://blog.csdn.net/u012759136/article/details/53355781
照着来没问题了吧,错了……build driver的时候直接说unable……我去
差了下说我下的版本不对,赶紧去重新找(为啥查到的帖子都是那个340.32版本)
http://www.nvidia.com/content/DriverDownload-March2009/confirmation.php?url=/XFree86/Linux-x86_64/384.98/NVIDIA-Linux-x86_64-384.98.run&lang=us&type=GeForce
这里下载17.11的版本
3)安装cuda toolkit,这次吸取教训,直接英伟达官网下载最新cuda9.1版本。
直接运行安装,居然自带了驱动……去死吧……
后面说我有几个库没装好,记录如下
Missing recommended library: libGLU.so
Missing recommended library: libX11.so
Missing recommended library: libXi.so
Missing recommended library: libXmu.so
搜索下直接apt-get搞定
$ sudo apt-getinstall freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
官方参考
https://devtalk.nvidia.com/default/topic/827410/cuda-setup-and-installation/new-installation-of-cuda-7-toolkit-in-ubuntu-12-04-question-about-missing-recommended-libraries-/
重装一遍cuda测试,一并安装了连同cuda的显卡驱动。没有问题。
http://blog.csdn.net/shiorioxy/article/details/52652831
http://blog.csdn.net/jhszh418762259/article/details/52958287
之后写几个配置
环境变量设置
sudo vim ~/.bashrc
在末尾添加
export CUDA_HOME=/usr/local/cuda-8.0
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64:$LD_LIBRARY_PATH
export PATH=/usr/local/cuda-8.0/bin:$PATH
保存退出。
然后刷新。
source ~/.bashrc
动态链接库设置
创建文件:
sudo vim /etc/ld.so.conf.d/cuda.conf
写入:/usr/local/cuda/lib64
保存之后使其立即生效:
sudo ldconfig -v
之后是测试sample,网上教程都是进utility编译,表示直接在根目录下编译了,很长时间……但是似乎没有报错退出。
许久之后,安全完成。
4. 安装cuDNN
直接搜索,英伟达官网注册,下载三个相关deb包,然后
$sudo dpkg -i xxxx.deb
应该就把库给安装好了。
4. 安装cuDNN
安装anaconda,没啥好说的。
5. 安装cuda-based TensorFlow
https://tensorflow.google.cn/install/install_linux
follow来,突然发现我的cuda版本和cuDNN版本都高了……先试试吧
pip install tensorflow-gpu
安全完成
但是使用的时候出现库缺失。然后conda安装我发现了这些……
你妹啊!直接集成了cuda8,我去!
但是用conda安装的tensorflow-gpu版本并不能正确执行,怀疑与环境已安装的有关。
https://devtalk.nvidia.com/default/topic/1026198/cuda-9-0-importerror-libcublas-so-8-0/
所以要重装cuda8
重装cuda8之后,采用gist一脚本安装cuDNN v6
https://gist.githubusercontent.com/mjdietzx/0ff77af5ae60622ce6ed8c4d9b419f45/raw/ebcb37e45ba14317330ffc1269159ed076242b9a/waya-dl-setup.sh
# install cuDNN v6.0
CUDNN_TAR_FILE="cudnn-8.0-linux-x64-v6.0.tgz"
wget http://developer.download.nvidia.com/compute/redist/cudnn/v6.0/${CUDNN_TAR_FILE}
tar -xzvf ${CUDNN_TAR_FILE}
sudo cp -P cuda/include/cudnn.h /usr/local/cuda-8.0/include
sudo cp -P cuda/lib64/libcudnn* /usr/local/cuda-8.0/lib64/
sudo chmod a+r /usr/local/cuda-8.0/lib64/libcudnn*
# set environment variables
export PATH=/usr/local/cuda-8.0/bin${PATH:+:${PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64\${LD_LIBRARY_PATH:+:${LD_LIBRARY_PATH}}
pip安装的预编译TensorFlow可以运行,但是有python版本不匹配,没有最适应CPU编译的提示。
因此TF还是自行编译得好……回来再折腾吧
6.安装opencv-python
pip install opencv-python
安全完成!
可以了,测试一下GTX760水平的cuda能否吊打E5-2643.
neural style风格迁移测试。
https://github.com/cysmith/neural-style-tf
测试成绩赛高,E5-2643 v4 @ 3.40GHz约1500秒,GTX760水平只用500s,约1/3时间。