本文主要说明进程间的几种通信机制,并对比起优缺点与使用场景。
I、IPC方式
进程间通信(IPC,InterProcess Communication)的主要方式包括:管道、FIFO、消息队列、信号量、共享内存已经socket。
1.1 管道
这一节中所说的管道为无名管道。
1、管道具有以下两种局限性:
· 管道为半双工的;
· 管道只能在具有公共祖先的两个进程之间使用,通常,一个管道由一个进程创建,在进程调用fork之后,这个管道就能在父进程和子进程之间使用了。
2、管道通过pipe
函数创建:
#include<unistd.h>
int pipe(int fd[2]); //成功返回0,出错返回-1
经由参数fd返回两个文件描述符:fd[0]为读而打开,fd[1]为写而打开。
3、 下图展示了父子进程之间的管道通信关系:
父进程的fd[1]端的输出通过管道可以连接到子进程的fd[0]端,从而实现通信。
fork之后做什么取决于我们所需要的数据流方向。
例如对于父进程到子进程管道,父进程关闭管道的fd[0]端,子进程关闭fd[1]端,就形成了一条单工的通信方式,只能由父进程发送至子进程:
再如经典的web服务器tinyhttpd所形成的通信结构如下图所示:
子进程负责执行cgi程序,将自己的管道端重定向(使用
dup2
)到标准输入输出,然后完成与父进程的交互。关于tinyhttpd的源码解析见:史上最详细的tinyhttpd源码注释
1.2、FIFO
FIFO即为命名管道,与无名管道不同的是,其可以在不相关的程序之间交换数据。
1、FIFO其实是一种文件类型,创建FIFO类似于创建文件:
#include<sys/stat.h>
int mkfifo(const char *path, mode_t mode);
int mkfifoat(int fd, const char *path, mode_t mode); //成功返回0,失败返回-1
mkfifoat
函数和mkfifo
函数相似,但是mkfifoat
函数可以被用来在fd文件描述符表示的目录相关的位置创建一个FIFO。
当我们用mkfifo
或者mkfifoat
创建FIFO时,都需要用open
来打开它。
2、FIFO有两种用途
· shell命令使用FIFO将数据从一条管道传送到另一条管道时,无须创建中间的临时文件。
· 客户进程-服务器进程应用程序中,FIFO用作汇聚点,在客户进程和服务器进程二者之间传递数据。
3、FIFO应用实例
实例1 用FIFO复制输出流:
FIFO可以用于复制一系列shell命令中的输出流。这就防止了将数据写向中间磁盘文件。这类似于使用管道(|)来避免中间磁盘文件。
考虑这样一个过程,它需要对一个经过过滤的输入流进行两次处理。下图展示了这种安排:
使用FIFO和UNIX程序tee
就可以实现这样的过程而无需使用临时文件(tee
程序将其标准输入同时复制到标准输出以及其命令行中命名的文件):
mkfifo fifo1
prog3 < fifo1 &
prog1 < infile | tee fifo1 | prog2
创建FIFO,在后台启动prog3,从FIFO中读取数据。然后启动prog1,用tee将其输出发送到FIFO和prog2:
实例2 使用FIFO进行客户进程-服务器进程通信:
如果有一个服务器进程,它与很多客户进程有关,每个客户进程都可以将其请求写到一个该服务器进程创建的“众所周知”的FIFO中(所有客户进程都知道该FIFO的路径名)。下图展示了这种安排:
这类问题在于服务器进程如何将回答送回各个客户进程。不能使用单个FIFO,因为客户进程不知道该何时去读属于它们自己的相应。
一种解决办法就是:每个客户进程都在其请求中包含自身的进程ID。然后服务器进程为每个客户进程创建一个FIFO,用于回应:
1.3 消息队列
1、消息队列是消息的链接表,存储在内核中,有消息队列标识符标识。
msgget
用于创建一个新的消息队列或打开一个现有队列。msgsnd
用于将新消息添加到队列尾端。msgrcv
用于从队列中去消息。:
#include<sys/msg.h>
int msgget(key_t key, int flag);
int msgsnd(int msqid, const void *ptr, size_t nbytes, int flag);
ssize_t msgrcv(int msqid, void *ptr, size_t nbytes, long type, int flag);
我们并不一定以先进先出的顺序取消息,可以按照消息的类型字段取消息。
1.4 信号量
1、信号量与管道,FIFO以及消息队列不同。它是一个计数器,用于为多个进程提供共享数据对象的访问。
2、 为了获得共享资源,进程需要执行下列操作:
1) 测试控制该资源的信号量;
2) 若此信号量的值为正,则进程可以使用该资源。在这种情况下,进程会将信号量值减1,表示它使用了一个资源单位;
3) 否则,若此信号量的值为0,则进程进入休眠状态,知道信号量的值大于0。进程被唤醒后,返回步骤1)。
当进程不在使用由一个信号量控制的共享资源时,该信号量值增1。如果有进程正在休眠等待此信号量,则唤醒它们。
3、 当我们想使用信号量时,首先通过函数semget
来获取一个信号量ID:
#include<sys/sem.h>
int semget(key_t key, int nsems, int flag);
semctl
函数包含了多种信号量操作:
#include<sys/sem.h>
int semctl(int semid, int semnum, int cmd, ... /* union semun arg*/);
semop
函数自动执行信号量集合上的操作数组:
#include<sys/sem.h>
int semop(int semid, struct sembuf semoparray[], size_t nops);
1.5 共享存储
1、共享存储允许两个或多个进程共享一个给定的存储区。
因为数据不需要在客户进程和服务器进程之间复制,所以这是最快的IPC。在多个进程同步访问一个给定存储区时,若服务器进程正在将数据放入存储区,则在它做完之前,客户进程不应该去取这些数据。
信号量用于同步共享存储访问。
2、shmget
函数获得一个共享存储标识符:
#include<sys/shm.h>
int shmget(key_t key, size_t size, int flag);
shmctl
函数对共享存储段执行多种操作:
#include<sys/shm.h>
int shmctl(int shmid, int cmd, struct shmid_ds *buf);
一旦创建了一个共享存储段,进程就可以调用shmat
函数将其连接到它的地址空间中:
#include<sys/shm.h>
void *shmat(int shmid, const void *addr, int flag);
当对共享存储段的操作已经结束时,调用shmdt
函数与该段分离,但这并不会删除标识符及其相关的数据结构。直至某个进程(一般是服务器进程)调用shmctl
特地删除它为止:
#include<sys/shm.h>
int shmdt(const void *addr);
1.6 socket
关于socket通信以后会专门写一篇文章说明。
II、几种IPC方式优缺点比较
1、如果用户传递的信息较少,或者只是为了出发某些行为。信号是一种简洁有效的通信方式。但若是进程间要求传递的信息量较大或者存在数据交换的要求,就需要考虑别的通信方式了。
2、无名管道与有名管道的区别在于单向通信以及有关联的进程。
3、消息队列允许任意进程通过共享队列来进行进程间通信。并由系统调用函数来实现消息发送和接收之间的同步。从而使得用户在使用消息缓冲进行通信时不再需要考虑同步问题,使用相对方便。
但是消息队列中信息的复制需要耗费CPU时间,不适宜信息量大或频繁操作的场合。
4、消息队列与管道方式的区别在于,消息队列可以实现多对多,并需要在内存中实现,而管道可以在内存或磁盘上实现。
5、共享内存无须复制,信息量大是其最大的优势。但是需要考虑同步问题。
【参考】
[1] 《UNIX环境高级编程》
欢迎转载,转载请注明出处wenmingxing 进程间通信及使用场景