TOOLS:LSF任务投递集群管理系统的使用

LSF系统类似于PBS/qsub系统。
投递任务命令:
bsub -n 16 -o test.out -e test.err -q normal ./test.sh

参数说明:

  • -n 指定运行的cpu数量可以是16或者8,24格式自定义最少和最大。数量最好是8的倍数。
  • -o 指定输出文件名
  • -e 指定错误输出文件名
  • -q 指定运行的节点
  • ./test.sh 是真正需要运行的任务。先添加可执行权限,chmod 757 ./test.sh
查看有哪些节点

bqueues

bqueues

可以看出,有fat和normal节点,一般小任务使用普通节点。normal

查看运行的任务

bjobs 参数 :

  • bjobs -u all 查看所有用户的任务
  • bjobs -u zhangsan 查看zhangsan的任务
  • bjobs -l 查看任务详细信息
  • 以宽格式来显示作业运行状态:
    bjobs -w
  • 显示所有作业:
    bjobs -a
  • 显示正在运行的作业:
    bjobs -r
  • 显示等待运行(pending)的作业和等待的原因:
    bjobs -p
    显示已经挂起(suspending)的作业和挂起的原因:
    bjobs -s
  • 显示JOBID这个作业的所有信息:
    bjobs -l JOBID
终止任务

bkill JOBID 删除指定的任务id
bkill 1441

其他常用命令

bpeek 查看目前的任务的标注输出
bhist 查看任务历史
yppasswd 修改用户的密码

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。