近一段时间,由于工作繁忙,一直没有时间来好好总结、梳理自己的知识体系。最近一段时间趁着比较得空,会陆续将对近一年来的笔记进行梳理,记录。一来巩固所学,进一步消化吸收;二来,供各位读者参考,共同学习进步。
- 安装Anaconda
在Anaconda installer archive选择合适的Anaconda版本右键复制下载链接,然后在Ubuntu命令行使用wget下载:
$ wget https://repo.anaconda.com/archive/Anaconda3-2019.10-Linux-x86_64.sh
下载完成后运行脚本安装:
$ bash Anaconda3-2019.10-Linux-x86_64.sh
下载vim编辑器:
$ sudo apt install vim
在命令行运行:
$ conda --version
如果报错,说明conda没有被加入环境变量,需要配置.bashrc
文件:
$ vim .bashrc
在文件的最后一行设置当前的Anaconda安装路径为环境变量,以我的路径为例:/home/***/anaconda3/
:
$ export PATH="/home/***/anaconda3/bin:$PATH"
再运行:
$ source .bashrc
执行修改好的.bashrc
文件
$ conda --veriosn
$ conda 4.7.12
此时会输出你当前的conda版本
- 安装显卡驱动
运行ubuntu-drivers devices
查看GPU型号和系统推荐驱动
可以使用
$ sudo ubuntu-drivers autoinstall
命令安装系统推荐版本(nvidia-driver-440 - distro non-free recommended),当然也可以安装指定版本的驱动:
$ sudo apt install nvidia-435
如果安装错误可以卸载显卡驱动
$ sudo apt-get --purge remove "*nvidia*"
$ sudo apt autoremove
卸载CUDA Toolkit
$ sudo apt-get --purge remove "*cublas*" "cuda*"
3.安装tensorflow
目前的Anaconda已经支持安装Tensorflow2.x版本,并且默认安装GPU版本。使用conda安装,会自动安装对应版本的CUDA和cuDNN,一劳永逸。
$ conda install tensorflow==2.1
不准备用conda安装的读者,可以参考经过Tensorflow官方测试的构建配置:
安装指定版本的cudnn
$ conda install cudnn=7.4.0
- 安装常用软件
安装Git
$ sudo apt install git
安装Opencv
$ sudo apt install opencv-python
安装神经网络可视化所需要的包
$ pip install pydot
$ sudo apt install graphviz
在模型训练时,最常遇见的就是OOM,倍感头疼,最后附一个张量显存计算的说明:
1 G = 1000 MB
1 M = 1000 KB
1 K = 1000 Byte
-
1 B = 8 bit
一般一个8-bit的整型变量所占的空间(8/8)为
1B
也就是8bit
。而32位的float则占(32/8)4B
也就是32bit
。而双精度浮点型double和长整型long在平常的训练中一般不会使用。
如一个shape位[64,600,1067]的float张量,总共呦64*600*1067个float型的数字,每个float为32bit即4B,则该张量在GPU中占用的显存大小为,将近164M。
关于显存计算的跟详细内容可以参考:
浅谈深度学习:如何计算模型以及中间变量的显存占用大小