IO复用模型

一、多进程和多线程的本质

  • 多个执行单位竞争CPU时间片

执行单位大部分时间都在阻塞等待客户端的数据到来(阻塞在read()或者accept())
活跃的就那么几个
就绪态,调度,分配时间片,运行态,恢复CPU现场
PCB保存了寄存器等信息
执行单位之间的切换太多,消耗了大量的时间

  • 每个执行单位中都有一个socket
    上面的这个呢,被我们称为阻塞的模型——

缺点是CPU切换太频繁

二、非阻塞轮询模型

  • 只启动一个进程,然后这个进程中来轮询每个套接字,把每个套接字都设置成非阻塞的,每个套接字都read()一遍,不断地轮询遍历

缺点是CPU可能会不断空转,即使没有数据CPU的使用率也会很高,即使加入一个sleep(),但是会导致实时性变差
优点是没有了阻塞模型中执行单位之间的切换

三、IO复用 模型

  • IO复用 = 反应堆
  • 套接字就是IO

四、select

  • 只能支持1024个文件描述符(1024位对应的是128个字节)
  • 反应堆fd_set

每一个文件描述符是否在这个fd_set集合中,在的话就置1

  • select()函数是用来监听文件描述符集合fd_set
  • select也是阻塞的,除非有一个文件描述符被触发了

select有3个反应堆

  • 处理返回的fd_sets就叫解复用

select是轮询的方式来监听反应堆的,我们可以看第一个参数是maxfds + 1来得知其本质

  • 最后一个参数timeout是一个结构体
  • NULL:一直阻塞,直到监听的反应堆里面有数据
  • timeout = 10:到了超时时间,就会返回,返回值可能为0也可能比0大
  • timeout = 0:直接返回,不会阻塞等待,相当于非阻塞
  • listenfd监听的数据是TCP层的数据(比如SYN报文FIN报文),不是应用层的数据
  • 反应堆fd_sets在select()中是一个传入传出参数,传入是告知监听哪些文件描述符,传出是告知有多少个文件描述符可读
  • 时间复杂度是O(n)

五、poll

  • poll——举手
  • poll反应堆(传入和传出区分开了)——结构体数组

所以poll是不需要重新初始化反应堆的,但是select需要
ulimit -a
/etc/limit.conf文件修改打开文件的数量

  • 时间复杂度是O(n)(处理n个连接)

  • poll的timeout——一个整型数

-1表示阻塞,0表示立即返回非阻塞,>0表示定时

  • select反应堆(传入传出参数整合在了一起)——文件描述符集合

需要重新初始化反应堆

  • select的timeout——结构体

六、epoll

  • 维护一棵树(内核空间中)
  • LT

隔一段时间就会检查是否从0变为了1,不能够及时地反馈

  • ET

可以捕捉的到0变为1的时刻,所以(错过了这个边缘,就永远都检测不出来事件触发了,但是LT则是后面只要是1,就会检测出来)

  • EPOLLONESHOT

用完一次后(只监听一次),监听完后会从树上摘下来

  • epollfd是一棵树的文件描述符

  • epoll_event是一个队列(用户空间),当有事件触发的时候,内核epoll_wait()会自动把对应节点的内容填充到就绪队列

  • timeout跟poll中是一样的

  • 返回值:有多少个fd被触发 了

就绪队列是以一个数组来实现的


  • 节点的具体内容(val)是epoll_event

  • close套接字文件描述符的时候,还要记着从反应堆中去除

  • O(log2N)是想象在整个树上只有一个节点被触发,找到这个节点的最大复杂度是O(log2N)

  • 高效的情景:1000个连接10个活跃

1000个连接1000个活跃的话,epoll还不如poll,因为epoll比poll多维护一棵树

epoll还不如poll,因为epoll比poll多维护一棵树

  • key-value, key是fd,value是epoll_event
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容