ubuntu16.04 环境
Lasagne的安装过程
scipy的测试scipy.test()可能会报错。安装pytest,用pip安装
测试lasagne的时候,mnist 的数据集下载的非常慢,可以自己下载,recurrent的测试没有问题。
安装过程各种坑
首先,ubuntu的分区,记得要给tmp分区,分出5G以上,省的出问题。
ubuntu的分区方案
首先去官网下载显卡驱动geforce我是驱动网址这个网址能查到历史版本
安装的正确姿势,下载对应平台下的run文件
首先卸载以前的驱动
sudo apt-get remove –purge nvidia*
sudo apt-get --purge remove xserver-xorg-video-nouveau
sudo apt-get autoremove
sudo nvidia-uninstall
参考
参考
(Ubuntu系统设置中其实可以选择nvidia驱动,但是通过这种方式只能是更新到7.5)
首先屏蔽开源驱动 nouveau
sudo gedit /etc/modprobe.d/blacklist.conf
在文件末尾添加如下内容
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
(这里有一行空格)
然后重启
sudo reboot
Ctrl-Alt+F1进入命令行,Ctrl-Alt+F7退出命令行
首先进入命令行,输入用户名和密码
关闭图形界面
sudo service lightdm stop
sudo chmod a+x NVIDIA-Linux-x86_64-375.20.run
sudo ./NVIDIA-Linux-x86_64-375.20.run –no-x-check –no-nouveau-check –no-opengl-files
最后安装完成后重启
参考
参考
参考
循环登录问题的解决方法
遇到过error in building the kernel 的问题是,这是下载的驱动程序版本问题。
到这里驱动安装结束,检验方法
glxinfo | grep rendering
nvidia-smi
----------------------------------我是分割线-------------------------------------
gcc版本问题
接着要安装cuda,目前nvidia官网最新的版本是cuda9.0,参考的博客安装的是8.0,所以在安装的时候出了我不能解决的问题,结果卸载了cuda9.0,安装了cuda8.0就成功了。安装cuda9.0在import theano时产生异常让我换驱动????问号脸
卸载cuda9.0的命令
sudo /usr/local/cuda-9.0/bin/uninstall_cuda_9.0.pl
具体的安装步骤参考
cuda8.0安装
-----------------------------------我是分割线--------------------------------------
安装lasagne
theano的gpu的配置和cuda的路径引用
参考
参考
MemoryError的解决方法
-----------------------------------我是分割线--------------------------------------
从论文中找到的代码发现跑起来有BUG
1.显式gpu内存不足
2.输入输出格式不对????
不是特别清楚,百度给的答案是可以改一下batchsize的大小,原文是256,改为56可运行,,
无论是配置还是程序,尽量保证与博客或者论文一致,再去更改。否则就会出现意想不到的错误。
-----------------------------------我是分割线--------------------------------------
遇到的问题:
unable to load the kernel module nvidia.ko 导致这个错误的原因是没有屏蔽掉nouveau驱动,网上给的方法不管用
解决方法:
sudo apt-get install linux-image-extra-virtual
reboot
vi /etc/modprobe.d/blacklist-nouveau.conf
blacklist nouveau
blacklist lbm-nouveau
options nouveau modeset=0
alias nouveau off
alias lbm-nouveau off
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
echo options nouveau modeset=0 | sudo tee -a /etc/modprobe.d/nouveau-kms.conf
sudo update-initramfs -u
reboot
问题:theano,gpu配置完成后,import theano报错显示将device=cuda
解决方法:将theano版本换为0.0.8
其实在WIN下的配置异常简单:
首先下载anaconda
在cmd中输入:conda install pandas jedi keras-gpu=2.1.2
安装h5py
numpy (minimum version: 1.9.1)
pyyaml
scipy (minimum version: 0.14)
six (minimum version: 1.9.0)
tensorflow or tensorflow-gpu
就ok了