最近决定开始从项目入手实战机器学习,第一步是在Ubuntu上搭建深度学习的环境,主要参考各个框架的官网和机器之心的这篇的文章:从零开始:深度学习软件环境安装指南。本文主要记录按照指南安装过程中遇到的一些问题。
搭建深度学习环境的各种库间的依赖关系如下图所示:
当然深度学习的框架还有很多,例如早期的Caffe、MXNet、百度的PaddlePaddle、阿里的PAI人工智能平台等,不过我认为初期学习时还是应先专注于某一种深入学习,由此入门以求融会贯通。
安装Python3.6
//添加python3.6安装包,并且安装
sudo apt-get install software-properties-common
//下载python3.6
sudo add-apt-repository ppa:jonathonf/python-3.6
sudo apt-get update
sudo apt-get install python3.6
//修改系统默认python版本为3.6,并更新
cd /user/bin
//删除当前的python.link
rm python
ln -s python3.6m python
python pip install --upgrade pip
update可更换清华的源https://mirror.tuna.tsinghua.edu.cn/help/ubuntu/
更新pip后Import Error:cannot import name main解决方案
https://blog.csdn.net/tintinetmilou/article/details/80091630
注意不要删除系统自带的3.5以及2.7版本,因为系统有很多依赖可能会因此崩溃。如果删除的话执行下面的命令重启恢复
sudo apt-get install ubuntu-minimal ubuntu-standard ubuntu-desktop
Installing Anaconda
推荐使用 Anaconda Python distribution,
- 设置虚拟环境
conda create -n cs231n python=3.6 anaconda
to create an environment called cs231n
.
Then, to activate and enter the environment, run
source activate cs231n
To exit, you can simply close the window, or run
source deactivate cs231n
Note that every time you want to work on the assignment, you should run source activate cs231n
(change to the name of your virtual env).
You may refer to this page for more detailed instructions on managing virtual environments with Anaconda.
Python virtualenv: Alternatively, you may use python virtualenv for the project. To set up a virtual environment, run the following:
安装Nvidia GPU driver
#显示与系统兼容的驱动版本
sudo add-apt-repository ppa:graphics-drivers/ppa
#添加并安装资源库,注意update与upgrade的区别
sudo apt-get update
sudo apt-get install nvidia-<driver_number>
安装CUDA与cuDNN
在Nvidia官网下载CUDA和cuDNN,按照官网指南下载即可,值得注意的是目前官网提供的版本是CUDA 9.0和cuDNN 7.0,而我们之后需要安装的框架提供的支持是CUDA 8.0,这会带来之后安装的一系列问题。
安装PyTorch
PyTorch的安装按照官网给出的命令即可,PyTorch 运行在 torchvision 和 torch两个库上,可以使用pip工具进行安装。Pip的安装升级可以使用如下命令:
sudo apt-get install python-pip python-dev
sudo pip install --upgrade pip
安装Tensorflow
Tensorflow的安装可以参考官网的指南,不过由于Tensorflow官方版本目前不支持CUDA9,直接使用pip安装会在import tensorflow时出现如下错误:
ImportError: libcusolver.so.8.0: cannot open shared object file: No such file or directory
这是因为在 /usr/local/cuda/lib64/ 下只有 libcusolver.so.9.0 这个文件,解决方法可以参考Github上Tensorflow的issue#12474和这篇总结:深度学习服务器环境配置使用源码安装Tensorflow。
安装Keras
参考官网可以使用pip或从Github上下载源码进行安装
sudo pip install keras