GPU版本tensorflow安装及介绍

安装GPU加速的tensorflow 卸载tensorflow

一: 本次安装实验环境

Ubuntu 16.04 + cuda9.0 + cudnn7.0

Ubuntu 16.04 + cuda8.0 + cudnn5.1

什么是CUDA呢?简单的来讲它是为了实现GPU运算的平台。我们的tensorflow会调用cuda的接口,利用显卡帮助我们运算程序

而CUDNN是为了加速神经网络用的

二: 卸载TensorFlow

先介绍卸载, 如果你的tensorflow是用pip安装的,那下面简单的命令就可以完成卸载了

    sudo pip uninstall tensorflow_gpu  
    sudo pip3 uninstall tensorflow_gpu

用 pip 还是pip3基于你是用python2 还是用python3安装的tensorflow

三: 关于驱动那点事:

安装之前要先换驱动,如果你之前换过,那可以跳过这步直接进入主题。
方法如下:
打开system settings --> software & Updates --> Additional Drivers
然后选择你需要的显卡驱动。(一般选择nvidia的显卡驱动)

Selection_016.png

如果还不清楚,或者不行,可参考这两个地址:

http://blog.csdn.net/tianrolin/article/details/52830422
http://blog.csdn.net/u012581999/article/details/52433609

在正式进入安装之前,请先把cuda和cudnn对应的版本下载好:
本教程给的例子是 : Ubuntu16.04 + cuda9.0 + cudnn7.0 + tensorflow1.9Ubuntu16.04 + cuda8.0 + cudnn5.1 + tensorflow1.9

对于cuda和cudnn的下载,官网链接如下:

https://developer.nvidia.com/cuda-toolkit-archive
https://developer.nvidia.com/rdp/cudnn-archive

如果官网网速不够,可以用我给的链接(没币私信):

https://download.csdn.net/download/chenhaojing/10591809

注意:这个版本搭配不是唯一的,首先你要了解你电脑的显卡是什么类型,然后根据你的显卡类型选择cuda的版本,在根据cuda的版本选择cudnn的版本,最后再根据前面两种的搭配选择tensorflow的版本

https://docs.nvidia.com/cuda/cuda-toolkit-release-notes/index.html

Selection_017.png

Selection_018.png

tensorflow 1.4 及以下选择cuda8.0 , 以上选择cuda9.0

安装cuda(以9.0为例子)

注意,下载.run文件,不要下载.deb文件,否则就踩坑了

安装命令:
sudo sh cuda_9.0.176_384.81_linux.run

执行后会给一段协议,按ctrl+c 跳过阅读, 然后 accept接受协议,选项如下:


Selection_019.png

你还会看到这个类似安装失败的提示:


Selection_020.png

别在意,要确定自己是不是安装成功,如下

验证是否安装完成
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
(或者手动进入改文件夹,注意,同样路径中cuda-9.0根据cuda的版本变化而变化)

 sudo  make (报错可以不管)

 ./deviceQuery
 如果显示的是关于GPU的信息,则说明安装成功了。
Selection_021.png

Selection_023.png

四:安装cudnn

同样注意安装版本,例子是cudnn 7.0
先解压:

tar -zxvf cudnn-9.0-linux-x64-v7.tgz

解压后有个cuda文件,内有include和lib64两个文件夹,进入include文件夹,执行如下命令:

    sudo cp cudnn.h /usr/local/cuda/include/     #复制头文件  

(或者直接执行 sudo cp cuda/include/cudnn.h /usr/local/cuda/include )
再cd命令切换进lib64文件夹,执行如下命令:

     sudo cp lib* /usr/local/cuda/lib64/    #复制动态链接库  

(或者直接执行 sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64 )

注意,按照网上一些版本不匹配的安装方法,这里执行后还要执行复制和删除软连接的操作,其实完全是多余的,当然,如果你不小心装错版本,是有必要修改软连接的

五:配置环境变量

我们就把cuda的环境变量配在 .bashrc 吧:

sudo gedit ~/.bashrc
把下面命令粘贴到文件末尾
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda-9.0/lib64
export PATH=$PATH:/usr/local/cuda-9.0/bin
export CUDA_HOME=$CUDA_HOME:/usr/local/cuda-9.0

六: 安装TensorFlow-gpu

先给正确的安装命令:

Anacanda 下的命令:(力推,如果不知道建议先去安装,这个极为方便)

pip install tensorflow-gpu==1.9

官网命令:

 sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.7.0-cp36-none-linux_x86_64.whl

清华影像命令:

 sudo pip install --upgrade https://mirrors.tuna.tsinghua.edu.cn/tensorflow/linux/gpu/tensorflow-1.7.0-cp36-none-linux_x86_64.whl

注意事项:

如果直接运行官网给的代码,网速可能很慢,毕竟是外国的网站。所以,我们不从官网下,去清华大学开源软件镜像站下载tensorflow.方法如下:

  1. https://storage.googleapis.com/ 替换为 https://mirrors.tuna.tsinghua.edu.cn/ 即可访问清华大学开源软件镜像站。
  2. 根据你想要的TensorFlow的版本,那么只需要修改tensorflow-1.7.0-cp36-none-linux_x86_64.whl
    比如,我要TensorFlow-1.0.1版本,那么上面官网地址就修改为:
sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.0.1-cp27-none-linux_x86_64.whl

如果你用python3.5, 那么在tensorflow-1.0.1后面把cp27该为cp35-cp35m,下载命令就变为:

sudo pip install --upgrade https://storage.googleapis.com/tensorflow/linux/gpu/tensorflow-1.0.1-cp35-cp35m-none-linux_x86_64.whl
  1. 如果改动不成功或者你不是Linux系统,那么请参考链接(以链接中的地址为主):

https://mirrors.tuna.tsinghua.edu.cn/help/tensorflow/

七: 测试

上面步骤都完成后进入测试:

>>> import tensorflow as tf
>>> hello = tf.constant('Hello, TensorFlow!')
>>> sess = tf.Session()
>>> print sess.run(hello)
Hello, TensorFlow!
>>> a = tf.constant(10)
>>> b = tf.constant(32)
>>> print sess.run(a+b)
42

错误解决方案

软链接出错

发现这一步出错的主要原因是您安装的cuda或cudnn版本引起的
可能会报如下错误:

Couldn't open CUDA library libcudnn.so. LD_LIBRARY_PATH:

这说明找不到文件 libcudnn.so ,这个文件其实是个软链接来着,他指向另外一个软件。
注意:这里有必要解释一下cuda和cudnn这两个文件。我们解压出来的lib64下面有3个so文件。分别是 libcudnn.so 和 libcudnn.so.5以及 libcudnn.so.5.1.12文件(当然,读者你的文件跟我不相同的概率很大,不过不要仅,下面会教你怎么修改软链接),并且这3个点so文件大小都一样。其实都是软连接!libcudnn.so链接到libcudnn.so.5,而libcudnn.so.5.又链接到libcudnn.so.5.1.12。 正真的文件只有libcudnn.so.5.1.12,因此我们要将/usr/local/lib64下的以前的这样的链接替换掉。由于装cuda时,比如我装的是cuda8.0,那么在/usr/local/下会生成cuda-8.0文件夹,以及一个cuda文件夹,cuda是软链接到cuda-8.0的,所以这两个文件夹可以看成一个。往任意一个文件夹中添加东西,另一个文件夹都会有相同的东西。

> cd /usr/local/cuda/lib64 
> ll libcudnn*

出现:

> lrwxrwxrwx 1 root root   13 3月   5 12:45 libcudnn.so -> libcudnn.so.5
> lrwxrwxrwx 1 root root   18 3月   5 14:38 libcudnn.so.5 ->libcudnn.so.5.1.10
> -rwxr-xr-x 1 root root  81M 3月   5 14:18 libcudnn.so.5.1.12
> -rw-r--r-- 1 root root 138M 3月   5 14:28 libcudnn_static.a

从上面可以看出,libcudnn.so 文件最终指向libcudnn.so.5.1.12
所以,我们要删去原来的软链接,重写加上正确的软链接

> sudo rm libcudnn.so.5 libcudnn.so.5.1.10 
> sudo ln -s libcudnn.so.5.1.12 libcudnn.so.5

再次查看:

ll libcudnn*

lrwxrwxrwx 1 root root   13 3月   5 12:45 libcudnn.so -> libcudnn.so.5
lrwxrwxrwx 1 root root   18 3月   5 14:38 libcudnn.so.5 -> libcudnn.so.5.1.10
-rwxr-xr-x 1 root root  81M 3月   5 14:18 libcudnn.so.5.1.10

多个cuda版本下可能会报的错

tensorflow-gpu is not working with Blas GEMM launch failed

InternalError (see above for traceback): Blas GEMM launch failed : a.shape=(1, 5), b.shape=(5, 10), m=1, n=10, k=5
     [[Node: layer1/MatMul = MatMul[T=DT_FLOAT, transpose_a=false, transpose_b=false, _device="/job:localhost/replica:0/task:0/gpu:0"](_arg_Placeholder_0_0/_11, layer1/weights/read)]]
     [[Node: layer2/MatMul/_17 = _Recv[client_terminated=false, recv_device="/job:localhost/replica:0/task:0/cpu:0", send_device="/job:localhost/replica:0/task:0/gpu:0", send_device_incarnation=1, tensor_name="edge_158_layer2/MatMul", tensor_type=DT_FLOAT, _device="/job:localhost/replica:0/task:0/cpu:0"]()]]

检查这个错误首先先确定是不是真的显卡不够,被其他程序占去了大部分,如果是,可以适当分配少量的显卡给tensorflow

gpu_options = tf.GPUOptions(per_process_gpu_memory_fraction=0.333)
sess = tf.Session(config=tf.ConfigProto(gpu_options=gpu_options))

如果你显卡内存剩于挺多的,那么可能是你在配置多版本cuda时没有清空之前cuda的缓存:

sudo rm -rf ~/.nv/     # 完美解决

可能会用到的操作

gcc版本降级

Ubuntu 16.04的gcc编译器是5.4.0,然而CUDA 8.0不支持5.0以上的编译器,因此需要降级,把编译器版本降到4.9。命令如下:

sudo apt-get install g++-4.9
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-4.9 20
sudo update-alternatives --install /usr/bin/gcc gcc /usr/bin/gcc-5 10
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-4.9 20
sudo update-alternatives --install /usr/bin/g++ g++ /usr/bin/g++-5 10
sudo update-alternatives --install /usr/bin/cc cc /usr/bin/gcc 30
sudo update-alternatives --set cc /usr/bin/gcc
sudo update-alternatives --install /usr/bin/c++ c++ /usr/bin/g++ 30
sudo update-alternatives --set c++ /usr/bin/g++

查看Ubuntu 16.04的Kernel,GCC和GLIBC的版本信息。

Kernel:

uname -sr #或 uname -r

GCC

gcc -v #或 gcc --version

GLIBC

$ ldd --version

参考网址

http://blog.csdn.net/tianrolin/article/details/52830422
http://blog.csdn.net/u012581999/article/details/52433609
https://www.cnblogs.com/mydebug/p/4972276.html
http://wiki.jikexueyuan.com/project/tensorflow-zh/get_started/os_setup.html
https://www.tensorflow.org/versions/r0.11/get_started/os_setup.html#optional-install-cuda-gpus-on-linux
https://zhuanlan.zhihu.com/p/33307112
http://blog.csdn.net/chcoolbeeboy/article/details/78110914
https://zhuanlan.zhihu.com/p/33307112
https://www.cnblogs.com/wangduo/p/7383989.html
https://www.tensorflow.org/install/#optional-install-cuda-gpus-on-linux
http://blog.csdn.net/s2010241013/article/details/55656248
https://www.cnblogs.com/apak/p/8410618.html
https://www.tensorflow.org/install/install_linux
https://mirrors.tuna.tsinghua.edu.cn/help/tensorflow/
http://blog.csdn.net/u014516389/article/details/72818155
http://blog.csdn.net/hungryof/article/details/52746279

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,686评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,668评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,160评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,736评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,847评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,043评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,129评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,872评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,318评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,645评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,777评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,470评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,126评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,861评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,095评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,589评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,687评论 2 351