Unix下可用的5种I/O模型:
- 阻塞式I/O
- 非阻塞式I/O
- I/O复用
- 信号驱动式I/O
- 异步I/O
阻塞式I/O
最流行的I/O模型是阻塞式I/O模型,默认情况下,所有套接字都是阻塞的。
非阻塞式I/O
进程把一个套接字设置成非阻塞是在通知内核,当所有请求的I/O操作非得把本进程投入睡眠才能完成时,不要把本进程投入睡眠,而是返回一个错误。
如图前2次调用recvfrom时没有数据返回,因此内核转而立即返回一个
EWOULDBLOCK错误,第3次调用时已有一个数据报准备好,它将被复制到应用进程缓冲区,于是recvfrom成功返回。
像这样的过程我们称之为轮询,应用进程持续轮询内核,已查看某个操作是否就绪,这样往往耗费大量CPU资源。
I/O复用
select/epoll的好处就在于单个进程就可以同时处理多个网络连接的IO。它的基本原理就是select,poll,epoll这些函数会不断的轮询所负责的所有socket,当某个socket有数据到达了,就通知用户进程。
以select为例,当用户进程调用了select,那么整个进程会被阻塞,而同时,内核会“监视”所有select负责的fd,当任何一个socket中的数据准备好了,select就会返回。这个时候用户进程再调用read操作,将数据从内核拷贝到用户进程。
I/O复用和阻塞式I/O相比不显得有什么优势,事实上,还更差一些。因为这里需要使用两个系统调用(select 和 recvfrom),而阻塞式I/O只有一个统调用(recvfrom)。
但是用select的优势在于它可以同时处理多个connection。所以,如果处理的连接数不是很高的话,使用select/epoll的web server不一定比使用multi-threading + blocking IO的web server性能更好,可能延迟还更大。select/epoll的优势并不是对于单个连接能处理得更快,而是在于能处理更多的连接。
在IO multiplexing Model中,实际中,对于每一个socket,一般都设置成为non-blocking。但是,如上图所示,整个用户的进程其实是一直被阻塞的。只不过进程是被select这个函数阻塞,而不是被socket IO给阻塞。
与I/O复用密切相关的另一种I/O模型是在多线程中使用阻塞式I/O。这种模型与上述模型即为相似,但它没有使用select阻塞在多个文件描述符上,而是调用多个线程(每个文件描述符一个线程)。
信号驱动
首先开启套接字的信号驱动式I/O功能,并通过sigaction系统调用安装一个信号处理函数。该系统调用将立即返回,进程继续工作。
当数据报准备好读取时,内核将为该进程产生一个SIGIO信号。然后在信号处理函数中调用recvfrom读取数据报。
这种模型的优势在于等待数据报到达期间进程不会被阻塞。
异步I/O模型
一般的说,异步I/O工作机制:告知内核启动某个操作,并让内核在整个操作(包括将数据从内核复制到我们自己的缓冲区)完成后通知我们。
它和信号驱动式I/O区别是:信号驱动式I/O是由内核通知我们何时可以启动一个I/O操作, 而异步I/O模型而是由内核通知我们I/O操作何时完成。
同步I/O和异步I/O对比
- 同步I/O 导致请求进程阻塞,直到I/O操作完成。
- 异步I/O 不会导致请求被阻塞。
根据上述定义,前4种模型-- 阻塞式I/O模型,非阻塞式I/O模型,I/O复用模型和信号驱动式I/O模型都是同步I/O模型,因为其中真正的I/O操作将阻塞进程。只有异步I/O模型与POSIX定义的异步I/O相匹配。
-
附:关于同步和异步更广泛的理解
同步和异步关注的是消息通信机制。
所谓同步,就是在发出一个调用时,在没有得到结果之前,该调用就不返回。但一旦调用返回,就得到返回值。意思是:调用者主动等待调用结果。
而异步则是相反,调用在发出之后,就立即返回,调用者并不一定会立即得到结果。意思是:被调用者通过状态,通知来告知知调用者结果。
阻塞与非阻塞关注的是程序在等待调用结果时的状态。
阻塞调用是指在调用结果返回之前,当前线程会被挂起,调用线程只有在得到结果之后才会返回。
非阻塞调用指在不能立刻得到结果之前,该调用不会阻塞当前线程。
参考资料
[1]《UNIX 网络编程》3th [美] W.Richard Stevens,Bill Fenner,Andrew M. Rudoff
[2] https://www.zhihu.com/question/19732473