IO复用模型

一、多进程和多线程的本质

多个执行单位竞争CPU时间片

执行单位大部分时间都在阻塞等待客户端的数据到来(阻塞在read()或者accept())
活跃的就那么几个
就绪态，调度，分配时间片，运行态，恢复CPU现场
PCB保存了寄存器等信息
执行单位之间的切换太多，消耗了大量的时间

每个执行单位中都有一个socket
上面的这个呢，被我们称为阻塞的模型——

缺点是CPU切换太频繁

二、非阻塞轮询模型

只启动一个进程，然后这个进程中来轮询每个套接字，把每个套接字都设置成非阻塞的，每个套接字都read()一遍，不断地轮询遍历

缺点是CPU可能会不断空转，即使没有数据CPU的使用率也会很高，即使加入一个sleep()，但是会导致实时性变差
优点是没有了阻塞模型中执行单位之间的切换

三、IO复用模型

IO复用 = 反应堆
套接字就是IO

四、select

只能支持1024个文件描述符(1024位对应的是128个字节)
反应堆fd_set

每一个文件描述符是否在这个fd_set集合中，在的话就置1

select()函数是用来监听文件描述符集合fd_set
select也是阻塞的，除非有一个文件描述符被触发了

select有3个反应堆

处理返回的fd_sets就叫解复用

select是轮询的方式来监听反应堆的，我们可以看第一个参数是maxfds + 1来得知其本质

最后一个参数timeout是一个结构体

NULL：一直阻塞，直到监听的反应堆里面有数据

timeout = 10：到了超时时间，就会返回，返回值可能为0也可能比0大

timeout = 0：直接返回，不会阻塞等待，相当于非阻塞

listenfd监听的数据是TCP层的数据（比如SYN报文，FIN报文），不是应用层的数据
反应堆fd_sets在select()中是一个传入传出参数，传入是告知监听哪些文件描述符，传出是告知有多少个文件描述符可读
时间复杂度是O(n)

五、poll

poll——举手
poll反应堆（传入和传出区分开了）——结构体数组

所以poll是不需要重新初始化反应堆的，但是select需要
ulimit -a
/etc/limit.conf文件修改打开文件的数量

时间复杂度是O(n)（处理n个连接）
poll的timeout——一个整型数

-1表示阻塞，0表示立即返回非阻塞，>0表示定时

select反应堆（传入传出参数整合在了一起）——文件描述符集合

需要重新初始化反应堆

select的timeout——结构体

六、epoll

维护一棵树（内核空间中）

隔一段时间就会检查是否从0变为了1，不能够及时地反馈

可以捕捉的到0变为1的时刻，所以快（错过了这个边缘，就永远都检测不出来事件触发了，但是LT则是后面只要是1，就会检测出来）

EPOLLONESHOT

用完一次后（只监听一次），监听完后会从树上摘下来

epollfd是一棵树的文件描述符
epoll_event是一个队列（用户空间），当有事件触发的时候，内核epoll_wait()会自动把对应节点的内容填充到就绪队列中
timeout跟poll中是一样的
返回值：有多少个fd被触发了

就绪队列是以一个数组来实现的

节点的具体内容(val)是epoll_event
close套接字文件描述符的时候，还要记着从反应堆中去除
O(log2N)是想象在整个树上只有一个节点被触发，找到这个节点的最大复杂度是O(log2N)
高效的情景：1000个连接10个活跃

1000个连接1000个活跃的话，epoll还不如poll，因为epoll比poll多维护一棵树

epoll还不如poll，因为epoll比poll多维护一棵树

key-value, key是fd，value是epoll_event

IO复用模型

IO复用模型

一、多进程和多线程的本质

二、非阻塞轮询模型

三、IO复用模型

四、select

五、poll

六、epoll

相关阅读更多精彩内容

友情链接更多精彩内容

IO复用模型

一、多进程和多线程的本质

二、非阻塞轮询模型

三、IO复用 模型

四、select

五、poll

六、epoll

相关阅读更多精彩内容

友情链接更多精彩内容

三、IO复用模型