MPI集群的搭建

1 使用虚拟机搭建小型集群

1.1 预备条件

  • 真实计算机系统:macOS Mojave 10.14.6
  • 虚拟机软件:VMware 11.0.1
  • 虚拟机个数:2
  • 虚拟机连接方式:桥接
  • Linux操作系统:CentOS 7
  • MPICH版本:3.3.1

1.2 小型虚拟集群搭建

  由于MPI是以进程方式进行并行计算,我们在使用MPI是要以真实的分布式集群作为程序运行条件,但是可以用个人电脑上的虚拟机来实现模拟集群的搭建过程,MPI并行环境的建立主要有三个关键步骤。

  一是利用SSH配置好节点间的通信,具体要实现集群内部各节点之间无需密码访问,因为MPICH在进行计算时需要在各个节点机交换数据和文件,集群内的各个节点应该为互相信任的节点。

  二是利用NFS服务来共享制定的文件夹,例如共享的安装文件夹、数据文件夹和程序的文件夹,这样就可以避免在所有节点上重复安装或者复制数据或分发程序

  三是对MPICH的配置、编译以及安装的过程。

1.2.1 主机名称重命名

  为了能够清晰地分辨不同的主机,我们可以对主机的名称进行修改。将第一台主机的名称修改为node1:hostnamectl set-hostname node1,第二台主机的名称为node2:hostnamectl set-hostname node2

1.2.2 修改hosts文件

  hosts文件是用来对主机名或域名做IP地址解析,如果修改此文件将主机名和IP地址关联,则我们在后面遇到关于输入IP地址的操作都可以用主机名称代替,当然也选择始终输入IP地址而无需更改此文件。使用vim命令打开并编辑/etc/hosts文件,在末尾加上IP地址 主机名称,需要注意的是要在所有节点下修改hosts文件。

#在node1和node2中都修改hosts文件才可生效
vim /etc/hosts
#文件内容如下
127.0.0.1   localhost localhost.localdomain localhost4 localhost4.localdomain4
::1         localhost localhost.localdomain localhost6 localhost6.localdomain6
172.27.80.248 node1 #此行为添加的内容
172.27.80.247 node2 #此行为添加的内容                 

  在node1和node2节点机分别按照上述修改hosts文件之后,可以使用ping操作验证node1和node2是否相互解析成功。

[root@node1 ~]# ping node2 
PING node2 (172.27.80.248) 56(84) bytes of data.
64 bytes from node2 (172.27.80.247): icmp_seq=1 ttl=64 time=0.074 ms
64 bytes from node2 (172.27.80.247): icmp_seq=2 ttl=64 time=0.032 ms
···
[root@node2 ~]# ping node1
PING node1 (172.27.80.248) 56(84) bytes of data.
64 bytes from node1 (172.27.80.248): icmp_seq=1 ttl=64 time=0.367 ms
64 bytes from node1 (172.27.80.248): icmp_seq=2 ttl=64 time=0.906 ms
···

1.2.3 设置SSH

useradd和adduser的区别:

  • useradd在后面不添加任何选项时,会创建一个没有主目录、没有密码、没有系统shell的用户。
  • adduser会提示用户去设置密码、创建目录。

adduser适合初学者但是较为繁琐,对于高级用而言可以使用useradd命令加上选项快速完成创建用户操作。

步骤一:在两台节点机下分别创建相同的用户mpi,并设置相同的密码方便记忆。使用useradd命令,并使用-u选项创建用户,-u选项的后面紧接uid号码,uid号码为用户的自行设置,在CentOS 7中要大于1000

[root@node1 ~]# useradd -u 1100 mpi
[root@node1 ~]# passwd mpi
[root@node2 ~]# useradd -u 1100 mpi
[root@node2 ~]# passwd mpi

步骤二:在node1节点机下使用su命令切换到mpi用户下

[root@node1 ~]# su - mpi
[mpi@node1 ~]$ 

步骤三:使用ssh-keygen生成证书密钥(公钥和私钥),存放在/home/mpi/.ssh下

[mpi@node1 ~]$ ssh-keygen -t dsa
#接下来遇到提示回车即可

步骤四:使用ssh-copy-id分别复制证书公钥到node1、node2节点机上,第一次复制证书时提示须输入yes,然后按照提示输入密码

[mpi@node1 ~]$ ssh-copy-id -i .ssh/id_dsa.pub mpi@node1
[mpi@node1 ~]$ ssh-copy-id -i .ssh/id_dsa.pub mpi@node2

步骤五:在node1节点上使用ssh登陆node2节点,无需密码即为免密登录成功

[mpi@node1 ~]$ ssh node2
[mpi@node2 ~]$ exit #退出node2远程登录

步骤六:使用scp复制证书私钥到node2节点机上,以实现相互免密登录

[mpi@node1 ~]$ scp .ssh/id_dsa node2:/home/mpi/.ssh

步骤七:在node2节点上使用ssh登录node1节点机,无需密码即为免密登录成功

[mpi@node2 ~]$ ssh node1
[mpi@node1 ~]$ exit #退出node1远程登录

1.2.4 关闭SELinux和防火墙

  SELinux(Security-Enhanced Linux) 是美国国家安全局(NSA)对于强制访问控制的实现,是 Linux历史上最杰出的新安全子系统。

  • 临时关闭SELinux:setenforce 0
  • 永久关闭SELinux:修改/etc/selinux/config文件信息,将SELINUX的等号右端改为disabled

  防火墙等安全设置是一项用于协助确保安全信息的设备,它会按照特定的规则,允许或是限制传输的数据通过。虽然说采用防火墙会保护用户数据的使用安全,但在一定程度上看会限制一些网络功能。由于CentOS 6和CentOS 7在防火墙的关闭操作上有很大区别,这里详细描述如何关闭CentOS 7的防火墙操作,CentOS 7默认使用的是firewall作为防火墙,具体关闭防火墙操作如下:

  • 查看防火墙状态:firewall-cmd --state
  • 停用防火墙:systemctl stop firewalld.service
  • 禁止开机启动防火墙:systemctl disable firewalld.service

  需要注意的是,在设置NFS之前应该关闭所有节点机的SELinux和防火墙,如果没有关闭则会导致SSH免密登陆和共享文件失败。

1.2.5 设置NFS

步骤一:安装NFS主程序的软件包nfs-utils和PRC主程序的软件包rpcbind(NFS的RPC服务在CentOS 5中的名称为portmap,在CentOS 6和CentOS 7中的名称为rpcbind)

yum -y install nfs-utils
yum -y install rpcbind

步骤二:编辑配置文件/etc/exports

vim /etc/exports

编辑内容的格式为[要共享的目录] IP地址或网段号([选项],[选项],···)

选项:

  • rw:表示读写操作
  • sync:表示同步操作
  • no_all_squash:表示远程用户不映射到nfsnobody

假如我们要共享有限个主机,只需按行分别写出IP地址后面加上以CIDR方式标注的子网掩码(/"二进制子网掩码中1的个数"),具体的IP地址和子网掩码请使用ipconfig命令查看并自行换算;假如我们要共享整个网段的主机,则直接填写网段号后面同样加上以CIDR方式标注的子网掩码。具体编辑配置文件的内容如下:

#若共享有限个主机,共享/home/mpi文件夹
/home/mpi 172.27.80.248/16 (rw,sync,no_all_squash)
/home/mpi 172.27.80.247/16 (rw,sync,no_all_squash)
#若共享整个网段,共享/home/mpi文件夹
/home/mpi 172.27.80.0/16 (rw,sync,no_all_squash)

步骤三:启动rpcbind服务和nfs服务使配置文件生效,需要注意的是在启动nfs服务之前需要启动rpcbind

systemctl start rpcbind #启动rpcbind服务
systemtctl start nfs #启动nfs服务

步骤四:在其他节点机上挂载nfs共享目录,此时node2节点机共享node1节点机的/home/mpi目录

[root@node2 mpi]# mount 172.27.80.248:/home/mpi /home/mpi #在node2节点下共享node1节点的文件
[root@node2 mpi]# su - mpi #切换到mpi用户下
Last login: Thu Aug  8 11:32:53 CST 2019 on pts/0
[mpi@node2 ~]$ touch test #在node2节点机下创建文件
[root@node1 mpi]# ls -l /home/mpi #在node1节点机下查看
total 0
drwxr-xr-x. 2 mpi mpi 40 Aug  7 20:50 Desktop
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Documents
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Downloads
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Music
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Pictures
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Public
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Templates
-rw-rw-r--  1 mpi mpi  0 Aug  8 11:34 test #文件存在
drwxr-xr-x. 2 mpi mpi  6 Aug  7 10:17 Videos

此时,nfs共享服务已经配置成功,需要注意的是假如我们在重新启动集群时,需要分别在不同的节点机上断开防火墙,重新启动rpcbind服务和nfs服务,再进行文件夹的挂载共享。

1.26 MPICH3.3.1安装

  此部分主要的安装过程和之前的文章《MPICH3.3.1 安装》大致相同,此时需要注意的是安装文件目录需改为/home/mpi/mpich-3.3.1,因为我们在之前配置NFS服务时已经将共享的文件目录设置为/home/mpi,同时需要将使用MPICH的root用户修改为mpi用户chown -R mpi:mpi /home/mpi

2 使用真实主机搭建小型集群

  需要使用交换机将真实主机连接在同一局域网下,使用手工配置网络,其余步骤相同。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,451评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,172评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,782评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,709评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,733评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,578评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,320评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,241评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,686评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,878评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,992评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,715评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,336评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,912评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,040评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,173评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,947评论 2 355