前提:已经安装好了驱动、cuda、cudnn等,再进行安装tensorflow。
anaconda安装TensorFlow-gpu过程
1.借助 清华大学开源软件镜像站,实现快速下载对应版本的Anaconda ,使用bash进行安装
$ bash Anaconda3-4.2.0-Linux-x86_64.sh
#注意:在这个过程中,全选“yes”。其中最后一个默认为“no”,要更改为“yes”。
若是,一不小心错过了更改最后一个“no”为“yes”,拯救方法如下:
(1) $ vim ~/.bashrc #打开~/.bashrc
(2) $ exportPATH=~/anaconda3/bin:$PATH. #写入路径
(3) $ source ~/.bashrc #激活
(4) $ conda --version #验证是否安装成功
2.激活~/.bashrc
$source ~/.bashrc
3.创建tensorflow2.7虚拟环境,并激活环境
$ conda create -n tensorflow2.7 python=2.7
$ source activate tensorflow2.7 #创建成功之后,$之前会出现虚拟环境名字(tensorflow2.7)提示
4.安装tensorflow-gpu
$ pip install tensorflow-gpu==1.1.0
5.编辑.bash_profile
$ vim ~/.bash_profile
在其中,设置好cuda安装的路径:
export LD_LIBRARY_PATH="$LD_LIBRARY_PATH:/usr/local/cuda-8.0/lib64"
export CUDA_HOME=/usr/local/cuda-8.0
6.激活.bash_profile
$ source ~/.bash_profile
7.使用进行验证:
$ python
$ >>import tensorflow as tf
>>tf.Session().
8.出现creating Tensorflow device,表示Tensorflow-gpu安装成功
9.退出tensorflow2.7的计算环境
$ source deactivate
再次进行python import测试的时候,显示缺失tensorflow模块
产生的原因:tensorflow的安装是在tensorflow2.7的计算环境中进行的。
所以,再次使用tensorflow的时候,再次激活即可:source activate tensorflow
自己在用的时候,感觉每次进入在退出,很麻烦。
所以重新在退出计算环境的情况下,重新安装了一下pip Install tensorflow-gpu==1.1.0.显示已安装成功
so .........
$ source ~/.bash_profile
$ source ~/.bashrc
再次,使用python的时候,即时是在退出tensorflow2.7的计算环境下也显示成功。
遇到的坑
1.在进行检测的过程中,import tensorflow的时候,出现ImportError:libcublas.so.9.0: cannot open shared object file: No such file or directory。
产生原因:所安装的tensorflow的版本和cuda的版本不一致(之前安装tensorflow-gpu的时候使用的是pip Install tensorflow-gpu。结果自动安装的是1.5.0版本tensorflow-gpu,而系统的cuda的版本为8.0——>不匹配)
解决方法:降低tensorflow-gpu的版本,在安装的时候,指定pip Install tensorflow-gpu==1.1.0即可
2.在同一台服务器上,使用iterm终端运行的使用gpu可用,但是在使用可视化桌面运行的使用gpu不可调用。
产生原因:在调用tensorflow-gpu失败的时候,大多数都是由于cuda的路径出错了
发现问题:
(1) 使用 import tensorflow 进行测试,发现在终端,存在tensorflow模块,但是在可视化桌面缺失tensorflow模块。
(2) 检查LD_LIBRARY_PATH
$ echo $LD_LIBRARY_PATH
此时,终端显示出cuda的路径,但是在可视化界面输出为空。则说明是tensorflow的路径出现了错误。
解决方法:
(1). $ sudo vim ~/.bashrc
exportLD_LIBRARY_PATH=”$LD_LIBRARY_PATH:/usr/local/cuda/lib64
exportCUDA_HOME=/usr/local/cuda”
(2). $ sudo vim ~/.bashrc
source之后,再次echo 两个终端中,都有路径的存在,并且import tensorflow 成功
3.在修改了/[.bashrc](https://www.jianshu.com/writer)或者是/.bash_profile 文件之后,一定、一定、一定要使用source进行激活。
4.解决pip的龟速安装
5.pip安装tensorflow时:
[115 ~]$ pip install tensorflow-gpu==1.1.0
Collecting tensorflow-gpu==1.1.0
Could not find a version that satisfies the requirement tensorflow-gpu==1.1.0 (from versions: )
No matching distribution found for tensorflow-gpu==1.1.0
解决方法:使用清华源进行安装,即可安装成功。
6.实际上,2017.12的时候,tensorflow 1.4及以下的不支持cuda9.0,且tensorflow1.0版本以上是不支持cuda8.0以下的。tensorflow-gpu1.5以后不支持使用CUDA8.0。cuda8.0对应的cuDNN必须是6.0版的。