一 内核接受网卡流量的整个流程
预备知识:
- 网络编程的核心对象是socket,当创建socket时在底层会创建一个由文件系统管理的socket对象。这个对象包括了发送缓冲区,接收缓冲区,等待队列。
- recv函数用于从某一个socket中接受流量,但是这个函数在被调用入进程会一直处于阻塞状态,直到从该socket收到数据为止。
网卡接收流量的流程:
- 步骤一:进程中调用了recv函数请求接收指定socket的流量。
- 步骤二:操作系统将这个进程加入到对应socket的等待队列中,并从CPU工作队列中移除,经过这一步后,进程会处理阻塞状态。
- 计算机接收到对端传输的数据,网卡把数据写入到内存中。这一步不需要CPU参与(数据不经过CPU直接从IO设备写入内存的技术叫作DMA技术)
- 数据写完后网卡会发送一个中断信号,中断CPU,通知CPU有数据到达。
- CPU中断程序响应中断,并把内存中的数据写入了对应socket的缓冲区里
- CPU唤醒进程,把进程从socket的等待队列中移除,然后加入到工作队列等待系统调用。
上面的流程有一个问题:
revc函数只能监控一个socket,并且会导致进程一直阻塞在这个socket中,直到socket中有数据返回为止。如果有多个socket监控,则需要创建多个进程,非常浪费资源。
而select和epoll就解决了上面的问题,它们让一个进程可以监控多个socket,下面分别说一下两个函数的实现细节。
二 select的实现细节
select一次监控多个socket的原理很简单:
- 它会把进程加入到它需要监控的所有socket的等待队列中,然后将进程从CPU 工作队列中移除,进入阻塞状态。
- 当这些socket中有一个socket有数据返回时,中断程序会把进程从所以的socket等待队列中移除,并把进程重新加入到CPU工作队列中,让进程进就绪状态。
- 进程进入被CPU调用到,只需要遍历所有socket的状态,就可以知道哪些socket可以读取数据了。
- 操作完这些可读取数据的socket之后,又会重复第一步,把进程加入到所有的 socket中,然后让进程进入阻塞状态。
通过上述的方式,select函数实现了在一个进程中监控多个socket的方法。但是这函数的性能并不高,因为它需要重复把进程从所有的socket中加入/移除。因此它监控的socket数量不能太多,底层规定不能超过1024个。
epoll函数针对select的这个缺陷作了改进,接下来说说epoll函数的实现细节。
三 epoll函数的实现细节
当进程调用epoll监控多个socket时,会在底层创建一个eventpoll对象,这个对象中包含一个重要的队列:就绪队列
- 进程调用epoll函数后,epoll会把这个进程加入eventpoll对象的等待队列中
- 然后把eventpoll对象加入到所有socket的等待队列中,并让CPU阻塞住
- 当某一个socket有数据返回时,CPU中断程序会把这个socket加入到eventpoll对象的就绪队列中,并把eventpoll中等待的进程唤醒。
- 进程被唤醒后直接从就绪队列中获取socket读取数据
- 数据读取完成后,epoll又会把进程加入到eventpoll的等待队列中,然后让CPU阻塞住。
epoll针对select优化的点:
- 除了第一次外,epoll不需操作所有socket对象的等待队列,只需要操作eventpoll的等待队列即可
- 进程被唤醒后,不需要遍历即可直接知道哪些socket准备好了。