IO 模型实现

基本 IO 模型

IO 模型

传统的 CS 网络模型

虚线标识网络连接的建立,实线表示链接建立后的请求/响应。

多线程网络模型

多线程网络模型.jpg

缺点:

  1. 每个链接都需要一个独立线程处理,链接的建立拆除伴随线线程的创建、销毁;
  2. 网络 IO 延迟导致线程可能多数时间处于阻塞状态;
  3. 大量建立链接请求到达服务端可能导致服务端创建线程过多;

线程池网络模型

线程池网络模型.jpg

多线程网络模型导致的 缺点1,缺点3 可以解决,但本质上是引入池技术解决线上的,并没有从 IO 技术层面解决阻塞问题。

IO 多路复用

对于网络 IO,一个基本操作需要分为两步:

  1. 等待网络数据分组到达,然后将其复制到内核缓冲区
  2. 把数据从内核缓冲区复制到应用空间缓冲区

主要的阻塞发生在第一步,而上线的模型中每个链接都需要单独的线程去处理。

如 Redis 这样的单进程应用,如果使用上面的网络模型,当某个网络操作将导致整个 IO 阻塞,其他的网络操作都得不到响应。

事实上 Redis 这类应用使用的是 IO 多路复用网络模型(这里复用指的是复用一个线程去处理多个链接):

构造一个感兴趣的文件描述符集合,然后调用文件函数,直到这些描述符中的一个已准备好进行 IO 时函数返回。poll, pselect 和 select 这三个函数可以帮助我们实现。

select & pselct

select 函数原型:

#include <sys/select.h>
int select(int maxfdp1, fd_set *restrict readfds, fd_set *restrict writefds, 
           fd_set *restrict exceptfds, struct timeval * restrict tvptr);

传递给 select 函数参数告诉内核:

  1. 关心的描述符
  2. 对每个描述符关心的的条件
  3. 原意等待的的时长

从 select 返回时内核返回:

  1. 已准备好的描述符总数量
  2. 对于读、写或异常这3个条件的每一个,哪些描述符已准备好

select 函数的参数含义:

  • tvptr:原意等待的事件长度
  • readfds, writefds, exceptfds:可读、可写、处于异常条件的描述符集合
  • maxfdpl:最大描述符编号加1,用于缩小查找范围

这里需要说明下 fd_set 数据类型,它是一个字节数组,每个文件描述符由一位表示。

pselect 函数最主要的改变是在 select 函数基础上增加了一个 sigmask 参数,用于指向信号屏蔽字

select & pselect 的问题:

  1. 单个进程所打开的描述符有限制,由FD_SETSIZE设置
  2. 内核会修改参数,每次调用需要重置
  3. 每次调用都需要遍历文件描述符
  4. 用户&内核空间数据拷贝

poll

select 的缺点很大程度是 fd_set 数据结构引入的,因此 poll 与 select 的差异也重点体现在了数据结构的不同。

poll 函数原型:

#include <poll.h>
int poll(struct pollfd fdarray[], nfds_t nfds, int timeout);

与 select 不同,poll 不为每个条件构造字符集,而是构造一个 pollfd 结构的数组:

struct pollfd {
    int fd;
    short events;
    short revents;
}

poll 本质上与 select 相同,但解决了 select 的问题1,2。但对于问题3 并没有解决

epoll

TODO

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。