同步和异步
同步和异步是用户线程与内核交互的方式,关注的是消息通知机制,是如何通知调用者.
同步: synchronous
调用发出之后, 不会立即返回,一旦返回即是最终结果
异步:asynchronous
调用发出之后, 被调用方立即返回消息, 但返回的并非最终结果,被调用者通过状态通知机制来通知调用者,或通过回调函数来处理结果
阻塞和非阻塞
阻塞和非阻塞是用户线程调用内核IO操作的方式,关注的是调用者等待被调用者返回调用结果时的状态(即中间过程)
阻塞:block
调用结果返回之前,调用者会被挂起,可能转为不可中断睡眠,调用者只有在等到返回结果之后才会继续处理新的请求.
非阻塞: nonblock
调用者在结果返回之前,不会被挂起,即调用不会被阻塞调用者
=====
I/O模型
阻塞式IO: blocking IO
同步阻塞IO模型是最简单的IO模型,用户线程在内核进行IO操作时被阻塞,处理不可中断睡眠,此过程中第一阶段它要一直处于等待状态.
非阻塞式IO:nonblocking IO
第一阶段它要盲等待(轮循),这种情况下, 会影响系统的整体性能,大量用户请求的情况下, 会降低性能.
复用型IO: multiplexing IO
也被称之为多路IO复用.其有selet(),poll(),select()等函数,select()要求最多不能超过1024个调用,prefork就是基于select的多路利用模型, 其select帮调用者阻塞,调用者能接受其它请求,第二阶段也会被阻塞(数据从内核空间至用户进程空间的过程). 通常一个进程只能处理一个IO,但web场景一般都是两路IO(磁盘和网络). 在内核中有新的IO调用,当调用者发起IO调用时,内核中有一个代理人(select,poll)帮其阻塞,并将请求转换为内核能理解的内容.
事件驱动式IO:signal driven IO
调用者发起调用后,被调用者收到请求后,立即返回收到消息(即在此动作中,调用者向内核注册了一个函数),当内核处理完成后, 再通知调用者.第一阶段非阻塞,第二阶段是阻塞的.event模型也采用了此种IO机制. nginx也是采用了此种IO机制(并且还是边缘触发,其也支持异步IO机制). 当有IO调用已经在内核完成时, 进程正忙于处理其它请求,未能处理新到的IO事件,此时内核将完成的事件存放于内核某位置,进程空闲时通过回调函数再进行读取.
异步IO
其由内核完成两个阶段后,再通知调用者,其epoll()函数就是异步IO机制.
mmap机制
直接将磁盘的地址映射到内存中,通知进程过来读取.
=======
一次完整的READ操作:
- 第一阶段: 等待数据准备好, 从磁盘到内存中.
- 第二阶段: 数据从内核空间至进程空间(此阶段被理解为真正的IO调用)