华为云服务器配置
- 名称:GPU加速型 p1.2xlarge.8
- CPU:Intel E5-2690V4 2.6GHz(8核)
- GPU:NVIDIA Tesla P100(单卡,16G)
- 内存:64G
- 硬盘:通用型SSD 100G
- 系统:CentOS 7.3 64bit for P100 | 公共镜像
显卡驱动升级
由于华为云GPU服务器自带的显卡驱动版本比较低,不适配当前新版的PaddlePaddle版本,所以先进行显卡驱动的升级。
- 查询Nvidia-Driver版本:
nvidia-smi
- 查询CUDA版本:
cat /usr/local/cuda/version.txt
- 清除所有nvidia相关文件和依赖:
yum remove nvidia-*
- 为了删除干净还可以(目标就是把nvidia-driver的相关组件都清理掉):
rpm -qa|grep -i nvid|sort
yum remove kmod-nvidia-*
- 在卸除驱动后一定记得重启:
sudo reboot
- 到官方下载指定驱动版本文件:NVIDIA-Linux-x86_64-440.118.02.run,然后运行安装:
sh NVIDIA-Linux-x86_64-440.118.02.run
-
然后按照提示框一步步ok就行了,最后使用nvidia-smi查询是否升级成功:
image.png
安装 Anaconda
Anaconda是1个常用的python包管理程序,里面可以设置好多个python环境。
- 下载 Anaconda 安装脚本
wget https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/Anaconda3-2021.05-Linux-x86_64.sh --no-check-certificate
- 下载完成后,执行安装,会提示你阅读授权,一直按回车就可以了
sh Anaconda3-2021.05-Linux-x86_64.sh
然后提示你是否同意,输入yes
安装过程中会询问你安装的位置,一般不用更改,输入回车就行,它会自动解压缩
最后会提示是否初始化Anaconda的一些配置,记得输入yes
- 安装好了之后,把Anaconda配置到环境变量,就可以用快捷 conda 命令了
vim ~/.bashrc #编辑环境配置文件export PATH="~/anaconda3/bin:$PATH" # 在第一行加入这个
vim 输入 i 可以编辑,编辑好了之后按 Esc, 然后输入 :wq 保存修改
- 保存好了之后更新环境变量,在命令行输入:
source ~/.bash_profile
最后验证一下是否配置成功,没有保存的话就是配置成功了!
- 安装好了之后,创建一个 python3.8的环境,执行一下命令,会有一个确认,输入 y ,然后回车就可以了
conda create --name paddle_env python=3.8 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
- 激活 paddle_env 环境
conda activate paddle_env
开始安装 PaddlePaddle
PaddlePaddle 是百度开源的深度学习框架
PaddlePaddle官网:https://www.paddlepaddle.org.cn
-
安装时根据自己的服务器配置选择对应的安装脚本
image.png 由于国内服务器访问Anaconda官方源可能会很慢,所以这里可以设置一下清华的镜像源
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/free/
conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main/
conda config --set show_channel_urls yes
- 开始安装GPU版Paddle, 也会有一个输入确认,输入y回车就好了,这里安装会有点久哦
conda install paddlepaddle-gpu==2.3.0 cudatoolkit=10.2 --channel https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/Paddle/
- 安装好PaddlePaddle 之后就可以开始其他安装了,例如:PaddleOCR、PaddleClas等