深度学习环境配置

ubuntu16.04 环境

Lasagne的安装过程
scipy的测试scipy.test()可能会报错。安装pytest,用pip安装

测试lasagne的时候,mnist 的数据集下载的非常慢,可以自己下载,recurrent的测试没有问题。

安装过程各种坑

首先,ubuntu的分区,记得要给tmp分区,分出5G以上,省的出问题。
ubuntu的分区方案

首先去官网下载显卡驱动geforce我是驱动网址这个网址能查到历史版本

安装的正确姿势,下载对应平台下的run文件
首先卸载以前的驱动

sudo apt-get remove –purge nvidia*
sudo apt-get --purge remove xserver-xorg-video-nouveau
sudo apt-get autoremove
sudo nvidia-uninstall

参考
参考
(Ubuntu系统设置中其实可以选择nvidia驱动,但是通过这种方式只能是更新到7.5)

首先屏蔽开源驱动 nouveau

sudo gedit /etc/modprobe.d/blacklist.conf

在文件末尾添加如下内容

blacklist vga16fb


blacklist nouveau

blacklist rivafb

blacklist nvidiafb

blacklist rivatv

(这里有一行空格)

然后重启

sudo reboot

Ctrl-Alt+F1进入命令行,Ctrl-Alt+F7退出命令行
首先进入命令行,输入用户名和密码
关闭图形界面

sudo service lightdm stop
sudo chmod a+x NVIDIA-Linux-x86_64-375.20.run
sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files

最后安装完成后重启
参考
参考
参考
循环登录问题的解决方法
遇到过error in building the kernel 的问题是,这是下载的驱动程序版本问题。
到这里驱动安装结束,检验方法

glxinfo | grep rendering
nvidia-smi

----------------------------------我是分割线-------------------------------------

gcc版本问题
接着要安装cuda,目前nvidia官网最新的版本是cuda9.0,参考的博客安装的是8.0,所以在安装的时候出了我不能解决的问题,结果卸载了cuda9.0,安装了cuda8.0就成功了。安装cuda9.0在import theano时产生异常让我换驱动????问号脸
卸载cuda9.0的命令

sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl

具体的安装步骤参考
cuda8.0安装
-----------------------------------我是分割线--------------------------------------
安装lasagne
theano的gpu的配置和cuda的路径引用
参考
参考

MemoryError的解决方法
-----------------------------------我是分割线--------------------------------------
从论文中找到的代码发现跑起来有BUG
1.显式gpu内存不足
2.输入输出格式不对????
不是特别清楚,百度给的答案是可以改一下batchsize的大小,原文是256,改为56可运行,,

无论是配置还是程序,尽量保证与博客或者论文一致,再去更改。否则就会出现意想不到的错误。

cuDNN

-----------------------------------我是分割线--------------------------------------

遇到的问题:

    unable to load the kernel module nvidia.ko 导致这个错误的原因是没有屏蔽掉nouveau驱动,网上给的方法不管用

解决方法:

sudo apt-get install linux-image-extra-virtual
reboot
vi /etc/modprobe.d/blacklist-nouveau.conf

blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv


echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf

sudo update-initramfs -u

reboot

问题:theano,gpu配置完成后,import theano报错显示将device=cuda

解决方法:将theano版本换为0.0.8

其实在WIN下的配置异常简单:
首先下载anaconda
在cmd中输入:conda install pandas jedi keras-gpu=2.1.2
安装h5py
numpy (minimum version: 1.9.1)
pyyaml
scipy (minimum version: 0.14)
six (minimum version: 1.9.0)
tensorflow or tensorflow-gpu
就ok了

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容