在上一篇中我们介绍了 mpi4py 中的近邻集合通信方法,下面我们将介绍 mpi4py 中的非阻塞通信子复制和组集合通信子创建方法。
非阻塞通信子复制方法 MPI.Comm.Idup 和组集合通信子创建方法 MPI.Comm.Create_group 都是 MPI-3 中新增的通信子创建方法。
在前面已经介绍了 MPI-1 和 MPI-2 中的通信子创建方法,其中 MPI.Comm.Dup 是一个阻塞的通信子复制方法,MPI.Comm.Create 是一个集合通信子创建方法,即处于调用该方法的通信子内的所有进程必须共同参与才能完成一个新的通信子的创建工作,即使所创建的新通信子只包含原通信子里面的部分进程。MPI.Comm.Create 的集合操作性在某些情况下可能会遇到问题,比如说只要一个通信子内的某一个或几个进程因出错误而死掉后,所有这个通信子上的集合操作都无法进行了,因为集合操作要求通信子上的所有进程共同参与。我们可以考虑将该通信子中正常的进程创建成一个新的通信子,并进行后续的计算工作。一种自然的想法是调用该通信子的 MPI.Comm.Create 方法,但是因为其集合操作性,我们无法在该通信子的某些进程死掉的情况下使用 MPI.Comm.Create 创建一个新的通信子,而且其它的集合通信子创建方法如 MPI.Comm.Dup,MPI.Comm.Split 等也都无法使用。MPI-1 和 MPI-2 中没有提供非集合的通信子创建方法,此限制可能会导致直到程序退出该通信子上的所有集合操作都无法进行。
MPI-3 引进的 MPI.Comm.Idup 是 MPI.Comm.Dup 的非阻塞版本,可以通过将通信子创建和其它计算重叠而提高程序的运行效率。
MPI-3 引进的 MPI.Comm.Create_group 是一个非集合操作,改进了 MPI.Comm.Create 的缺陷,它可以在某个通信子上的部分进程参与的情况下下创建一个新的通信子。
方法接口
下面给出这两个新的通信子创建方法的使用接口。
MPI.Comm.Idup(self)
非阻塞地复制当前通信子,返回一个由新创建的通信子 comm_new
和一个 MPI.Request 对象 req
组成的二元 tuple。注意:在没有调用 req
的 Wait,Test 等方法以等待或测试该非阻塞调用完成之前,新通信子 comm_new
并未真正创建成功,不能进行通信工作。
MPI.Comm.Create_group(self, Group group, int tag=0)
在已有通信子 comm 环境下,利用 group
组创建新的通信子 newcomm
,但不会复制原通信子中添加的属性信息。是一个非集合操作方法,只要求处于 group
中的所有进程执行这个调用,对那些不在组 group
中的进程,返回的 newcomm
值为 MPI.COMM_NULL。group
参数可以为 MPI.GROUP_NULL。注意:如果 group 不是 comm 所关联组的子集或者不同进程中变量 group 所包含的组内容不同,则会发生错误。tag
参数用来区分对该方法的多次调用。
例程
下面给出这两个新方法的使用例程。
# Idup.py
"""
Demonstrates the usage of Idup and Create_group.
Run this with 4 processes like:
$ mpiexec -n 4 python Idup.py
"""
import numpy as np
from mpi4py import MPI
comm = MPI.COMM_WORLD
rank = comm.Get_rank()
# Idup
comm_dup, req = comm.Idup()
req.Wait()
recv_obj = comm_dup.scatter([1, 2, 3, 4], root=0)
print 'rank %d has %d' % (rank, recv_obj)
# make one process die
if rank == 0:
# process 0 dies
exit()
# other processes can still work
# Create_group
# sub_comm = comm.Create(comm.group.Excl([0])) # dead lock for Create
sub_comm1 = comm.Create_group(comm.group.Excl([0])) # OK for Create_group
print 'sub_comm1.rank %d <-> comm.rank %d' % (sub_comm1.rank, rank)
sub_comm2 = comm.Create_group(comm.group.Excl([0, 1])) # OK for Create_group
if rank >=2:
print 'sub_comm2.rank %d <-> comm.rank %d' % (sub_comm2.rank, rank)
else:
print sub_comm2 == MPI.COMM_NULL
sub_comm3 = comm.Create_group(MPI.GROUP_NULL) # OK for Create_group
print sub_comm3 == MPI.COMM_NULL
运行结果如下:
$ mpiexec -n 4 python Idup.py
rank 1 has 2
sub_comm1.rank 0 <-> comm.rank 1
True
True
rank 2 has 3
sub_comm1.rank 1 <-> comm.rank 2
sub_comm2.rank 0 <-> comm.rank 2
True
rank 3 has 4
sub_comm1.rank 2 <-> comm.rank 3
sub_comm2.rank 1 <-> comm.rank 3
True
rank 0 has 1
以上介绍了 MPI-3 中引进的非阻塞通信子复制和组集合通信子创建方法,在下一篇中我们将介绍 MPI-3 中增强的单边通信方法。