[TOC]
Centos7安装-多节点PbsPro
PBS 是公开源代码的作业管理系统,pbspro是著名的open PBS的商业版。其相关的介绍请看我写的相关博客。
1:准备
1.1 机器
准备两个机器(centos7),机器名分别为pbsmaster和pbsslave
修改两个机器的/etc/hosts文件,确保两个机器可以ssh互相访问
机器 | IP |
---|---|
pbsmaster | 192.168.64.55 |
pbsslave | 192.168.64.56 |
1.2 安装包
下载地址:https://github.com/PBSPro/pbspro/releases
1.3 制作RPM包
提前安装依赖包
$yum -y install rpm-build
$yum -y install gcc autoconf automake libtool hwloc-devel
$yum -y install libX11-devel libXt-devel libedit-devel libical-devel ncurses-devel postgresql-devel python-devel python-devel tcl-devel tk-devel swig expat-devel openssl-devel libXext libXft
以下命令使用root用户运行
$mkdir -p /root/rpmbuild/SOURCES/
$mv pbspro-14.1.0.tar.gz /root/rpmbuild/SOURCES/pbspro-14.1.0.tar.gz
$cd /root/rpmbuild/SOURCES && tar zxvf pbspro-14.1.0.tar.gz
$cd /root/rpmbuild/SOURCES/pbspro-14.1.0 && rpmbuild -ba pbspro.spec
执行上面命令后,会在/root/rpmbuild/RPMS/x86_64目录下生成几个rpm包
pbspro-client-14.1.0-0.x86_64.rpm
pbspro-debuginfo-14.1.0-0.x86_64.rpm
pbspro-execution-14.1.0-0.x86_64.rpm
pbspro-server-14.1.0-0.x86_64.rpm
2:安装
2.1 安装Master
登录master节点,然后以root用户运行
$yum install -y pbspro-server-14.1.0-0.x86_64.rpm
修改/etc/pbs.conf文件
PBS_SERVER=pbsmaster
PBS_START_MOM=1
2.2 安装Slave
登录Slave节点,然后以root用户运行
$yum install pbspro-execution-14.1.0-0.x86_64.rpm
修改/etc/pbs.conf文件
PBS_SERVER=pbsmaster
PBS_START_MOM=1
修改/var/spool/pbs/mom_priv/config文件
$clienthost pbsmaster
2.3 启动pbs
分别在pbsmaster和pbsslave节点上运行以下命令启动pbs
# /etc/init.d/pbs start
将slave节点加入集群
# . /etc/profile.d/pbs.sh
# qmgr -c 'create node pbsslave'
3:测试
使用普通用户登录master节点,然后运行
$adduser user1
$su user1
# 查看节点状态 free则节点添加正常
$pbsnodes -a
# 提交作业
$echo 'sleep 10' | qsub
# 查看作业
$qstat -a
4:问题
1 查看pbsnodes的节点为down
查看ssh服务是否开启,然后重启pbs
参考资料
1:使用RPM包安装PBS Pro
2:使用ssh在Docker容器间建立互信
3:Docker容器安装单节点PbsPro
4:Docker容器安装多节点PbsPro
5:Centos7安装-单节点Torque
6:Centos7安装-多节点Torque
7:Centos7安装-多节点PbsPro
2017/11/16-Boy