LSF系统类似于PBS/qsub系统。
投递任务命令:
bsub -n 16 -o test.out -e test.err -q normal ./test.sh
参数说明:
- -n 指定运行的cpu数量可以是
16
或者8,24
格式自定义最少和最大。数量最好是8的倍数。 - -o 指定输出文件名
- -e 指定错误输出文件名
- -q 指定运行的节点
- ./test.sh 是真正需要运行的任务。先添加可执行权限,
chmod 757 ./test.sh
查看有哪些节点
bqueues
可以看出,有fat和normal节点,一般小任务使用普通节点。normal
查看运行的任务
bjobs 参数 :
- bjobs -u all 查看所有用户的任务
- bjobs -u zhangsan 查看zhangsan的任务
- bjobs -l 查看任务详细信息
- 以宽格式来显示作业运行状态:
bjobs -w - 显示所有作业:
bjobs -a - 显示正在运行的作业:
bjobs -r - 显示等待运行(pending)的作业和等待的原因:
bjobs -p
显示已经挂起(suspending)的作业和挂起的原因:
bjobs -s - 显示JOBID这个作业的所有信息:
bjobs -l JOBID
终止任务
bkill JOBID
删除指定的任务id
bkill 1441
其他常用命令
bpeek
查看目前的任务的标注输出
bhist
查看任务历史
yppasswd
修改用户的密码