基本 IO 模型

IO 模型

传统的 CS 网络模型

虚线标识网络连接的建立，实线表示链接建立后的请求/响应。

多线程网络模型

多线程网络模型.jpg

缺点：

每个链接都需要一个独立线程处理，链接的建立拆除伴随线线程的创建、销毁；
网络 IO 延迟导致线程可能多数时间处于阻塞状态；
大量建立链接请求到达服务端可能导致服务端创建线程过多；

线程池网络模型

线程池网络模型.jpg

多线程网络模型导致的缺点1，缺点3 可以解决，但本质上是引入池技术解决线上的，并没有从 IO 技术层面解决阻塞问题。

IO 多路复用

对于网络 IO，一个基本操作需要分为两步：

等待网络数据分组到达，然后将其复制到内核缓冲区
把数据从内核缓冲区复制到应用空间缓冲区

主要的阻塞发生在第一步，而上线的模型中每个链接都需要单独的线程去处理。

如 Redis 这样的单进程应用，如果使用上面的网络模型，当某个网络操作将导致整个 IO 阻塞，其他的网络操作都得不到响应。

事实上 Redis 这类应用使用的是 IO 多路复用网络模型（这里复用指的是复用一个线程去处理多个链接）：

构造一个感兴趣的文件描述符集合，然后调用文件函数，直到这些描述符中的一个已准备好进行 IO 时函数返回。poll, pselect 和 select 这三个函数可以帮助我们实现。

select & pselct

select 函数原型：

#include <sys/select.h>
int select(int maxfdp1, fd_set *restrict readfds, fd_set *restrict writefds, 
           fd_set *restrict exceptfds, struct timeval * restrict tvptr);

传递给 select 函数参数告诉内核：

关心的描述符
对每个描述符关心的的条件
原意等待的的时长

从 select 返回时内核返回：

已准备好的描述符总数量
对于读、写或异常这3个条件的每一个，哪些描述符已准备好

select 函数的参数含义：

tvptr：原意等待的事件长度
readfds, writefds, exceptfds：可读、可写、处于异常条件的描述符集合
maxfdpl：最大描述符编号加1，用于缩小查找范围

这里需要说明下 fd_set 数据类型，它是一个字节数组，每个文件描述符由一位表示。

pselect 函数最主要的改变是在 select 函数基础上增加了一个 sigmask 参数，用于指向信号屏蔽字

select & pselect 的问题：

单个进程所打开的描述符有限制，由FD_SETSIZE设置
内核会修改参数，每次调用需要重置
每次调用都需要遍历文件描述符
用户&内核空间数据拷贝

poll

select 的缺点很大程度是 fd_set 数据结构引入的，因此 poll 与 select 的差异也重点体现在了数据结构的不同。

poll 函数原型：

#include <poll.h>
int poll(struct pollfd fdarray[], nfds_t nfds, int timeout);

与 select 不同，poll 不为每个条件构造字符集，而是构造一个 pollfd 结构的数组：

struct pollfd {
    int fd;
    short events;
    short revents;
}

poll 本质上与 select 相同，但解决了 select 的问题1，2。但对于问题3 并没有解决

epoll

TODO

IO 模型实现