VScode通过SSH连接远程服务器进行模型训练

1.准备环境:

通常选择GPU服务器来进行训练,服务器的环境是Ubuntu,服务器上的显卡驱动,cuda,cuDNN,cudatoolkit都需要版本对应且提前配置好

#查看显卡驱动版本,以及可支持的最高cuda版本
nvidia-smi
#查看当前系统安装的cuda版本
nvcc --version

Pytorch与cudatoolkit对应关系:https://blog.csdn.net/Z_zfer/article/details/124648956?spm=1001.2014.3001.5502

2.VSCode连接

Vscode插件搜索ssh,进行安装,然后连接到远程服务器

#输入连接命令
ssh 用户名@ip地址 -p 端口号
#输入密码

3.连接成功之后,配置开发环境

1)安装Anaconda

#清华大学开源软件镜像站
https://mirrors.tuna.tsinghua.edu.cn/anaconda/archive/


#安装
bash Anaconda3-2020.07-Linux-x86_64.sh 

#配置anaconda的环境变量

2)配置conda源

#windows环境下---编辑C:\Users下面的.condarc 文件

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.bfsu.edu.cn/anaconda/cloud
  msys2: https://mirrors.bfsu.edu.cn/anaconda/cloud
  bioconda: https://mirrors.bfsu.edu.cn/anaconda/cloud
  menpo: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.bfsu.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.bfsu.edu.cn/anaconda/cloud
#Linux环境下---编辑/home/用户名目录下的~/.condarc文件

channels:
  - defaults
show_channel_urls: true
default_channels:
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/main
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/r
  - https://mirrors.bfsu.edu.cn/anaconda/pkgs/msys2
custom_channels:
  conda-forge: https://mirrors.bfsu.edu.cn/anaconda/cloud
  msys2: https://mirrors.bfsu.edu.cn/anaconda/cloud
  bioconda: https://mirrors.bfsu.edu.cn/anaconda/cloud
  menpo: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch: https://mirrors.bfsu.edu.cn/anaconda/cloud
  pytorch-lts: https://mirrors.bfsu.edu.cn/anaconda/cloud
  simpleitk: https://mirrors.bfsu.edu.cn/anaconda/cloud

3)创建一个新的conda环境

#查看当前存在哪些虚拟环境
conda env list 

#创建conda环境
conda create --name condaname python=3.7

#激活当前conda环境
conda activate condaname

#安装所需要的库---如果有requirements.txt文件
pip install -r requirements.txt
#安装所需要的库---如果有导出的conda环境
conda env export --file condaname .yml --name condaname    #导出环境配置
conda env create  -f condaname .yml   #新设备部署环境

#使用pip临时换源安装----临时换源安装matplotlib
pip install matplotlib -i https://mirrors.aliyun.com/pypi/simple/ 

#查看当前环境里面安装的库
conda list

#退出虚拟环境
source deactivate condaname 

#删除虚拟环境
conda remove -n condaname --all

4.从GitHub上面导入项目

采用git命令导入,如果没有git请提前安装

#创建一个文件夹
mkdir project
cd project
#导入命令--- git clone 项目名
git clone https://github.com/gaocong13/Projective-Spatial-Transformers.git

5.在当前conda环境下执行python xxx.py文件开始训练

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容