一、硬件配置
在安装之前最好先检查自己的显卡是否支持GPU。
内存:8G
处理器:Intel® Core™ i5-7500 CPU @ 3.40GHz × 4
显卡:GeForce GT 730/PCIe/SSE2
操作系统类型:64位
二、安装
安装参照链接(https://zhuanlan.zhihu.com/p/50302396),非常感谢黄大佬的分享,参照以上链接安装基本没问题。
本人一开始错以root用户安装,导致后面在普通用户环境下“他import tensorflow as tf”出现错误
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ModuleNotFoundError: No module named 'tensorflow'
以及错误
ImportError: libcublas.so.10.0: cannot open shared object file: No such file or directory
Failed to load the native TensorFlow runtime.
后来是改到普通用户环境下重新执行安装步骤解决问题。
具体安装步骤如下:
1. 英伟达显卡驱动安装
默认安装的显卡驱动不是英伟达的驱动,所以先把旧得驱动删除掉。
sudo apt-get purge nvidia*
禁止自带的nouveau nvidia驱动
sudo vim /etc/modprobe.d/blacklist-nouveau.conf # 打开配置文件
填写禁止配置的内容:
blacklist nouveau
options nouveau modeset=0
更新配置文件,
sudo update-initramfs -u
添加Graphic Drivers PPA
- sudo add-apt-repository ppa:graphics-drivers/ppa
- sudo apt-get update
查看合适的驱动版本:
ubuntu-drivers devices
从图中可以看出可以选择的驱动版本,在这里我选择的版本是396。通过如下命令进行安装:安装完后需要进行重启。
1 # 安装
2 sudo apt-get install nvidia-driver-396
3 # 重启
4 sudo reboot
安装完后,通过如下命令检测是否安装成功,如果成功会显示如下图所示。
sudo nvidia-smi
sudo nvidia-settings
完成显卡驱动的安装。
2. cuda 9.0 安装
2.1 下载文件
首先在官网上下载run 文件,如图所示,选择合适run文件。
同时下载4个Patch
2.2 安装依赖库
sudo apt-get install freeglut3-dev build-essential libx11-dev libxmu-dev libxi-dev libgl1-mesa-glx libglu1-mesa libglu1-mesa-dev
2.3 降低gcc、g++的版本
g++ --version # 查看版本
安装指定版本
- sudo apt-get install gcc-5
- sudo apt-get install g++-5
通过命令替换掉之前的版本:
- sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 50
- sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 50
最后记得再次查看版本是否修改成功。
2.4 安装cuda
进入下载目录后,依次执行命令:
注意:在安装过程中会提示是否需要安装显卡驱动,在这里要选择n,其他的选择y或者回车键进行安装:
- sudo sh cuda_9.0.176_384.81_linux.run
- sudo sh cuda_9.0.176.1_linux.run
- sudo sh cuda_9.0.176.2_linux.run
- sudo sh cuda_9.0.176.3_linux.run
- sudo sh cuda_9.0.176.4_linux.run
在~/.bashrc 中设置环境变量:
sudo vi ~/.bashrc
在最后添加:
export PATH=/usr/local/cuda-9.0/bin{PATH}}
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64{LD_LIBRARY_PATH}}
运行
source ~/.bashrc
重启后,测试CUDA是否成功
第一步,进入例子文件
cd /usr/local/cuda-8.0/samples/1_Utilities/deviceQuery
第二步,执行make命令
sudo make
第三步
./deviceQuery
如果结果有GPU的信息,说明安装成功。
3. 安装CUDNN
下载链接: 官网
需要登录,同意后才能下载。
Download cuDNN v7.4.1(Nov 8, 2018), for CUDA 9.0 --cuDNNLibrary for Linux
下载时候保存为:cudnn-9.0-linux-x64-v7.4.1.5.tgz
进入下载目录,并执行以下命令:
- tar -zxvf cudnn-9.0-linux-x64-v7.4.1.5.tgz
- sudo cp cuda/include/cudnn.h /usr/local/cuda/include
- sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
- sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
没有报错就是全部安装完成了。
4. 安装anaconda
1. 下载地址:https://www.anaconda.com/download/
这里下载的是Python 3.7 64bit 的Anaconda3-5.3.0-Linux-x86_64.sh,首先进入下载目录i,直接安装即可。
bash Anaconda3-5.3.0-Linux-x86_64.sh
2. 更改pip和conda为国内的源
A. 更改pip的源为阿里云:
mkdir ~/.pip
cat > ~/.pip/pip.conf << EOF
[global]
trusted-host=mirrors.aliyun.com
index-url=https://mirrors.aliyun.com/pypi/simple/
EOF
B. 更改conda的源为清华大学:
- conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- conda config --set show_channel_urls yes
3. 在Anaconda中安装Python3.6的虚拟环境
conda create --name tensorflow python=3.6 #创建tensorflow环境
虚拟环境主要命令:
- source activate tensorflow #激活tensorflow环境
- source deactivate tensorflow #退出tensorflow环境
- conda remove --name tensorflow --all #删除tensorflow环境(全部删除)
5. 安装Tensorflow GPU 1.9.0
注意:这里如果直接用pip安装的话,在ubuntu上会直接默认安装到系统默认的python环境中,而不是虚拟环境tensorflow中
激活虚拟环境tensorflow,用conda进行安装
conda install tensorflow-gpu==1.9.0
在使用conda命令时,如果遇到conda命令错误,可以在终端执行
export PATH=~/anaconda3/bin:$PATH
然后再使用conda命令进行安装
参考链接:
- https://zhuanlan.zhihu.com/p/50302396
- https://blog.csdn.net/weixin_41863685/article/details/80303963
喜欢就点个赞吧