机器学习远程端实验心得1
前一段时间从机器人实验室转到现在的深度学习,自然语言处理实验室。很多东西和以前完全不同,特别是做实验的方法,大家也都是搞计算机科学的,直接用远程端服务器跑就可以了,也得对linux很了解,才能熟练使用各种工具。
自己也在其中摸索了许久才慢慢获得一些心得。
1. 远程端登录
首先是如何登录远程服务器。先从管理员那儿拿到一个有根权限的账号,这里假设为admin。用ssh登录,然后创建自己的账户,设置密码。
ssh admin@address
sudo adduser your_username
sudo passwd your_username
sudo user mode -aG your_group your_username
有了自己的账户之后,以后就可以直接这样登录了。
ssh your_username@address
2. 环境管理
一般来说,都是用python来做各种实验的。但是,问题是从网上下载各种实验时,各自要求的运行环境依赖也都完全不一样。有时候,跑半天跑不出来。这时候就需要来产生各种环境。我们可以安装Anaconda.
之后创建环境,和管理环境。常用的几个命令。
conda env list # 列出所有环境
conda list # 列出当前环境所有的package
conda search package #在当前环境搜索 package
conda create -n env_name python=2.7 # 创建新环境,之后可以配置这个环境的初始配置
source activate env_name # 激活创建的环境
source deactivate env_name # 回到默认环境
conda install packages # 在当前环境下安装包
conda remove --name rm_env_name --all # 移除环境
关于各种详细命令的话可以参考这个网页Using Conda,自己搜索。
3. 文件同步
远程工作还有一个问题是怎么来同时管理两边的文件。比如说编辑,同步什么的。
一般来说,都是在远程端跑程序,而在自己电脑上写程序,当然如果你vim用得特别棒的话,那就另当别论了。但是一般假设大家都是像我一样用sublime text这样的编辑器来编辑代码。
我的话是这样子来进行的。首先在github上建立自己的项目,之后clone到自己的终端。然后利用rsync来同步终端和远程端的代码。
常用代码如下。
rsync -azP source_path destination # 从source_path同步到destination
# 举个例子 比如要从1**.1**.1**.1**的用户andy的home目录的source同步到终端home的dest
rsync -azP andy@1**.1**.1**.1**:~/source/ ./dest # -a是achieve同步,z压缩传输,P显示传输信息
# 如果想要不同步某些文件的话,后面加这个就可以了
rsync --exclude=pattern_to_exclude
详细请看How To Use Rsync to Sync Local and Remote Directories on a VPS.