keras的官方安装过程:https://keras-cn.readthedocs.io/en/latest/for_beginners/keras_linux/#keras
一、配置环境准备
参考:https://blog.csdn.net/fyz530357172/article/details/79207764
sudo apt-get update
sudo apt-get install python-dev python-pip python-nose gcc g++ git gfortran
sudo apt-get install libprotobuf-dev libleveldb-dev libsnappy-dev libopencv-dev libhdf5-serial-dev protobuf-compiler
sudo apt-get install --no-install-recommends libboost-all-dev
sudo apt-get install libopenblas-dev liblapack-dev libatlas-base-dev
sudo apt-get install libgflags-dev libgoogle-glog-dev liblmdb-dev
sudo apt-get install git cmake build-essential
二、下载Nvida的驱动程序
使用sudo lshw -numeric -C display查明显卡情况:
*-display
description: VGA compatible controller
product: NVIDIA Corporation [10DE:1B81]
vendor: NVIDIA Corporation [10DE]
physical id: 0
bus info: pci@0000:01:00.0
version: a1
width: 64 bits
clock: 33MHz
capabilities: pm msi pciexpress vga_controller bus_master cap_list rom
configuration: driver=nvidia latency=0
resources: irq:126 memory:ee000000-eeffffff memory:d0000000-dfffffff memory:e0000000-e1ffffff ioport:e000(size=128) memory:c0000-dffff
lspci -nnk | grep -A3 -i nvidia
下载地址:https://www.nvidia.cn/Download/index.aspx?lang=cn
安装时使用:NVIDIA-Linux-x86_64-390.42.run
参考:https://blog.csdn.net/eclipse_c/article/details/23302061
解决下列问题:
在ubuntu16桌面环境下安装时会出现下列问题:
安装显卡前准备工作:
第一步:禁用显卡:sudo gedit /etc/modprobe.d/blacklist-nouveau.conf
加入变量:blacklist nouveau option nouveau modeset=0
然后执行:sudo update-initramfs-u
第二步:
sudogedit ~/.bashrc
加入:
export LD_LIBRARY_PATH=/usr/lib/x86_64-linux-gnu:$LD_LIBRARY_PATHexport LD_LIBRARY_PATH=/lib/x86_64-linux-gnu:$LD_LIBRARY_PATH
执行:
source~/.bashrc
第三步:(如果安装过)卸载之前安装过nvidia驱动(参考https://blog.csdn.net/fyz530357172/article/details/79207764):sudo apt-getremove--purge nvidia-*
第四步:然后使用下列命令:
1. 按住CTRL+ALT+F1 进入命令行
2. sudo service lightdm stop
3. sudo init 3
4. 安装驱动程序: #: sudo ./NVIDIA-Linux-x86_64-390.42.run
5. 按照提示安装完成,简单方法重启就好了 sudo reboot
三、安装cuda文件
参考:https://blog.csdn.net/fu6543210/article/details/79758234
第一步:去官网下载CUDA 9.0,请务必下载.run文件。
https://developer.nvidia.com/cuda-90-download-archive?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1604&target_type=runfilelocal
第二步:执行sudo sh cuda_9.0.176_384.81_linux.run
单击回车,一路往下运行,输入 accept
直到提示“是否为NVIDIA安装驱动?”,选择 no,
后面问你是否安装 cuda toolkit 选yes
其他的全都是默认,不过要记住安装位置,它会问你输入路径,直接按 enter键 。默认是安装在/usr/local/cuda文件夹下。又问你是否安装在默认路径下,你输入yes。
第三步:配置cuda的环境变量
sudo ~/.bashrc
加入:
export PATH=/usr/local/cuda-9.0/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-9.0/lib64$LD_LIBRARY_PATH
然后:reboot
第四步测试是否成功:nvcc -V
有显示你的cuda信息就OK了,你也可以做下面的:
测试CUDA的例子
cd /usr/local/cuda-9.0/samples/1_Utilities/deviceQuery
sudo make ./deviceQuery
如果显示的是关于GPU的信息,则说明安装成功了。
四、安装cudnn
使用:TensorFlow GPU version 1.12.0 CUDA 9.0.
参考:https://stackoverflow.com/questions/53194827/cannot-train-keras-convolution-network-on-gpu
使用cudnn 7.3.1成功
第一步解压:下载:cudnn-9.0-linux-x64-v7.3.1.20.tgz(官网注册下载)
tar xzvf cudnn-9.0-linux-x64-v7.3.1.20.tgz
cd cuda
sudo cp lib64/lib* /usr/local/cuda/lib64/
sudo cp include/cudnn.h /usr/local/cuda/include/
第二步:更新软件链接库
cd /usr/local/cuda/lib64/
sudo chmod +r libcudnn.so.7.3.1(根据下载的版本不同而有所不同) # cd /usr/local/cuda/lib64/
sudo ln -sf libcudnn.so.7.3.1 libcudnn.so.7
sudo ln -sf libcudnn.so.7 libcudnn.so
sudo ldconfig
五、安装anaconda
本人使用python2.7,所以下载Anaconda2-5.3.1-Linux-x86_64.sh
第一步:sudo bash Anaconda2-5.3.1-Linux-x86_64.sh
第二步:conda create -n tensorflow python=2.7
第三步:
安装最新版本的带gpu的tensorflow
pip install tensorflow-gpu
第四步:
安装相对应的最新版本keras
pip install keras
第五步:
pip install ipython
第六步:
pip install spyder
第七步:
conda install pyqt
整个安装时间2小时左右
五、简单的案例测试
测试中会打印使用的显卡信息