分布式管理系统使用笔记

分布式管理系统使用笔记

有幸在工作中体验了几个计算集群的使用,几乎每个计算集群都有专门的集群调度系统,而当需要在短时间对多个系统做测试是第一道障碍就是熟悉各个调度系统的操作指令,以下列举近期使用到的几个分布式作业调度系统的常用操作指令和几个超算中心使用体验

广州超算天河二号

普通刀片节点配备 两颗 Intel(R) Xeon(R) CPU E5-2692 v2 @ 2.20GHz 共24物理核,内存为64G
调度系统为 Slurm, 以下为常用指令

yhi(sinfo): 显示系统资源使用情况
yhi命令可查看当前账号可用队列的状态信息,主要用于查看队列中空闲节点情况,常用命令还有yhi -n cn12345查看指定节点信息, yhi -p paratera 查看指定队列信息

yhq(squeue): 显示作业状态
yhq可查看已投递任务的简要信息,包括任务状态、所在计算节点等信息,常用参数有-j 指定jobid,-u 指定用户, -p 指定队列, -w 指定计算节点进行查看任务信息

yhrun(srun): 交互式作业提交
常用命令 yhrun -N 1 -n 1 -c 24 -p paratera job.sh,由于天河服务器采用任务独占节点形式,所以每节点的任务最好设置为24

yhbatch(sbatch): 批处理作业提交
后台提交任务,功能与yhrun相同,命令yhbatch -N 1 -n 1 -c 24 job.sh

yhcancel(scancel): 取消已提交的作业
命令用法yhcancel JOBID

yhacct(sacct) 查看历史作业信息
yhacct -u pp100 -S 03/01/17 -E 03/31/17 --field=jobid,partition,jobname,user,nnodes,start,end,elapsed,state

国家超算无锡中心神威-太湖之光

国家超算无锡中心神威-太湖之光包括商用x86平台和国产平台,国产平台采用申威26010处理器,有专用编译器,尚不支持JAVA, python, R等语言,x86平台普通节点配备两颗 Intel(R) Xeon(R) CPU E5-2680 v3 @ 2.50GHz CPU,共24物理核,内存为128G
调度系统不明,可能是自研的, 以下为常用指令

qload -w: 显示可用队列资源使用情况

bsub: 提交作业
常用参数 bsub -q q_x86_share -N 1 -o job.out /path/job.sh, 注意投递任务脚本路径必须填写绝对路径

bjobs: 显示作业状态

bkill JOBID: 取消已提交的作业

福建省超算中心曙光集群

福建省超算中心曙光集群普通计算节点配备 2颗 Intel(R) Xeon(R) Gold 6132 CPU @ 2.60GHz 共28物理核,内存为188G,在体验期间曾遇到频繁开启关闭超线程现象,同时也有幸在同系统内对开启或关闭超线程做了点小测试,测试结果显示开启超线程对计算密集型进行有小幅加速效果,但在以核时计费的系统中需要注意,开启超线程将会导致耗费核时为实际情况的两倍,此集群只有一个登录节点,节点运行程序较多,有mysql运行在登录节点,从一定程度上反映出集群管理不是很专业
调度系统为PBS, 以下为常用指令

pestat: 查看计算节点使用情况

qsub job.pbs: 提交作业
job.pbs中填写提交参数与执行程序,参数格式为 #PBS -q queue

qstat: 查看已提交作业
可通过-u 参数指定用户名进行只查看自己的任务

qdel JOBID: 取消已投递作业

某高校计算集群

普通计算节点配备两颗Intel(R) Xeon(R) Gold 6150 CPU @ 2.70GHz CPU,36物理核,内存188G,是体验中单节点性能最好的集群
调度系统为 LSF, 以下为常用指令

bqueues: 查看可用队列信息

bhosts: 查看计算节点使用情况

bsub: 提交作业
简单任务参数,bsub -q queue -J name -n 36 -R span[hosts=1] -o name.out -e name.err /path/job.sh

bjobs: 查看已提交作业

bkill JOBID: 取消已提交作业

自建计算集群

调度系统为 SGE, 以下为常用指令

qconf -sql: 显示队列
qconf -sq QUEUE: 显示指定队列信息

qhost: 查看计算节点使用情况

qsub: 提交作业

qstat:查看已提交作业

qdel JOBID: 取消已提交作业

分布式管理系统常用指令速查表

管理系统 队列信息 资源信息 提交作业 查看作业 取消作业
Slurm yhi/sinfo sbatch squeue scancel
神威 qload -w qload bsub bjobs bkill
PBS qstat -q pestat qsub qstat qdel
LSF bqueues bhosts bsub bjobs bkill
SGE qconf -sql qhost qsub qstat qdel

欢迎您继续补充完善

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,277评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,689评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,624评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,356评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,402评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,292评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,135评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,992评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,429评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,636评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,785评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,492评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,092评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,723评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,858评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,891评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,713评论 2 354

推荐阅读更多精彩内容