一、多进程和多线程的本质
- 多个执行单位竞争CPU时间片
执行单位大部分时间都在阻塞等待客户端的数据到来(阻塞在read()或者accept())
活跃的就那么几个
就绪态,调度,分配时间片,运行态,恢复CPU现场
PCB保存了寄存器等信息
执行单位
之间的切换太多,消耗了大量的时间
- 每个执行单位中都有一个socket
上面的这个呢,被我们称为阻塞的模型
——
缺点是CPU切换太频繁
二、非阻塞轮询模型
- 只启动一个进程,然后这个进程中来
轮询每个套接字
,把每个套接字
都设置成非阻塞的
,每个套接字都read()一遍,不断地轮询遍历
缺点是CPU可能会不断空转,即使没有数据
CPU的使用率
也会很高,即使加入一个sleep(),但是会导致实时性
变差
优点是没有了阻塞模型中执行单位之间的切换
三、IO复用 模型
- IO复用 = 反应堆
- 套接字就是IO
四、select
- 只能支持1024个文件描述符(1024位对应的是128个字节)
- 反应堆fd_set
每一个文件描述符是否在这个fd_set集合中,在的话就置1
- select()函数是用来
监听文件描述符集合fd_set
- select也是阻塞的,除非有一个文件描述符被触发了
select有3个反应堆
- 处理返回的fd_sets就叫
解复用
select是轮询的方式来监听反应堆
的,我们可以看第一个参数是maxfds + 1
来得知其本质
- 最后一个
参数timeout
是一个结构体
- NULL:一直阻塞,直到监听的反应堆里面有数据
- timeout = 10:到了超时时间,就会返回,返回值可能为0也可能比0大
- timeout = 0:直接返回,不会阻塞等待,相当于非阻塞
-
listenfd
监听的数据是TCP层的数据(比如SYN报文
,FIN报文
),不是应用层的数据 - 反应堆fd_sets在select()中是一个
传入传出
参数,传入是告知监听哪些文件描述符,传出是告知有多少个文件描述符可读 - 时间复杂度是
O(n)
五、poll
- poll——举手
- poll反应堆(传入和传出区分开了)——结构体数组
所以poll是不需要
重新初始化
反应堆的,但是select需要
ulimit -a
/etc/limit.conf
文件修改打开文件的数量
时间复杂度是O(n)(处理
n
个连接)poll的timeout——一个整型数
-1表示阻塞,0表示立即返回非阻塞,>0表示
定时
- select反应堆(传入传出参数整合在了一起)——文件描述符集合
需要
重新初始化
反应堆
- select的timeout——结构体
六、epoll
- 维护一棵树(内核空间中)
- LT
隔一段时间就会检查是否从0变为了1,不能够及时地反馈
- ET
可以捕捉的到0变为1的时刻,所以
快
(错过了这个边缘
,就永远都检测不出来事件触发
了,但是LT则是后面只要是1,就会检测出来)
- EPOLLONESHOT
用完一次后(只监听一次),监听完后会从树上摘下来
epollfd
是一棵树的文件描述符epoll_event
是一个队列(用户空间),当有事件触发的时候,内核epoll_wait()会自动把对应节点的内容填充到就绪队列
中timeout跟poll中是一样的
返回值:有
多少个fd
被触发 了
就绪队列是以一个数组来实现的
节点的具体内容(val)是
epoll_event
close套接字文件描述符的时候,还要记着从
反应堆
中去除O(log2N)是想象在整个树上只有一个节点被触发,找到这个节点的最大复杂度是
O(log2N)
高效的情景:1000个连接10个活跃
1000个连接1000个活跃的话,epoll还不如poll,因为epoll比poll多维护一棵树
epoll还不如poll,因为epoll比poll多维护一棵树
- key-value, key是fd,value是epoll_event