Linux 网络编程之 I/O 模型

I/O 模型大致分为 5 类:同步阻塞 I/O,同步非阻塞 I/O,异步 I/O,I/O 复用,信号驱动。

  • 阻塞 I/O:如 recv、read,一直等,直到接收缓冲区有数据。
  • 非阻塞 I/O:设置描述符为非阻塞后,若接收缓冲区有数据则读,无数据立即返回,但进程需要一直检查是否可读。
  • I/O 复用:它可以同时处理多个连接,原来单路的是一个处理完才能接入新的连接。人们常说的 select/poll/epoll 仅仅是查询多路复用 I/O 状态的方式。
  • 信号驱动:采用信号等待机制,不用监视描述符了,也不用阻塞着等待数据到来。等待信号通知,调用相应的信号处理函数,这个信号告知应用程序的是“现在可以进行 I/O 了”。
  • 异步 I/O:应用程序发送 I/O 请求后不用等也不用主动发送获取结果的请求,收到通知时,系统已经把数据读好了(是的,这个通知也不是告诉你数据到了去取吧,而是直接告知你 I/O 请求过程已经结束了),应用程序可以直接处理数据了。

1. 阻塞 I/O

几乎所有的程序员第一次接触到的网络编程都是从 listen()、send()、recv() 开始的,这些接口都是阻塞型的(接口的使用介绍见《socket编程在TCP中的应用》)。下面是一个简单的“一问一答”型服务器:

Figure 1-1 单线程阻塞 I/O

当用户进程调用了 recv() 这个系统调用,kernel 就开始了 I/O 的第一个阶段:准备数据。对于网络 I/O 来说,很多时候数据在一开始还没能完整到达,这个时候 kernel 就要等待足够的数据到来。而在用户进程这边,整个进程会被阻塞。kernel 一直等到数据准备好了,就将数据从 kernel 中拷贝到用户内存,然后返回结果,用户进程才解除阻塞状态,重新运行起来。

稍微改进一下 Figure 1-1 中的 CS 模型,将服务器改为多线程的,可以同时为许多客户端提供“一问一答”型服务:

Figure 1-2 多线程阻塞 I/O

这样任何一个连接的阻塞都不会影响其他的连接。主线程持续等待客户端的连接请求,如果有连接,则创建新线程,并在新线程中提供为前例同样的问答服务。

TCP 服务器不是一对一的吗?这样多次调用 accept() 没关系吗?

  • 一个端口肯定只能绑定一个 socket,但这个 socket 可能会产生很多“socket 连接”。要是服务器性能好一个端口就可以绑定无数个“socket连接”(其实也不是无数个,假设使用 IPv4 的话就是 IPv4 的地址空间 * 端口号个数 = 248 个,假设服务器内存够存)。
  • 五元组(本地 IP,本地端口,远程 IP,远程端口,协议)唯一标识服务器的一个 socket,其中协议通过 socket() 方法指定,然后本地 IP 和端口通过 bind() 方法绑定(想要多次绑定同一对 IP 端口一定会报错),最后 accept() 方法绑定发来连接请求(connect())的客户端 IP 和端口,想连多少连多少。
  • TCP 的一对一指的是 accept() 方法产生的连接套接字只能对应一个客户端,但监听套接字下可能已经对应了许多客户端。

上述多线程的服务器模型似乎完美的解决了为多个客户机提供问答服务的要求,但若要同时响应成百上千路的连接请求,无论多线程还是多进程都会严重占据系统资源,降低响应效率。很多程序员可能会考虑使用线程池连接池。这两种技术都可以很好的降低系统开销。

  • 线程池旨在减少创建和销毁线程的频率,维持一定合理数量的线程,并让空闲的线程重新承担新的执行任务。
  • 连接池维持 socket 连接,尽量重用已有的连接,减少创建和关闭连接的频率。

但是,“线程池”和“连接池”技术也只是在一定程度上缓解了频繁调用 I/O 接口带来的资源占用问题。而且“池”始终有其上限,当请求大大超过上限时,“池”构成的系统对外界的响应并不比没有“池”的时候好多少。所以使用“池”必须考虑其面临的响应规模,并根据响应规模调整“池”的大小。

总之,多线程模型可以方便高效的解决小规模的服务请求,但面对大规模的服务请求,多线程模型也会遇到瓶颈,可以用非阻塞接口来尝试解决这个问题。

2. 非阻塞接口

在 Linux 中,默认情况下所有的 socket 都是阻塞的,要设置成非阻塞的可以参考如下程序:

void setnonblocking(int sock) {
    int opts;
    opts = fcntl(sock, F_GETFL);    // 读取文件状态标识
    if (opts < 0) {
        perror("fcntl(sock, GETFL)");
        exit(1);
    }
    opts = opts|O_NONBLOCK;
    if (fcntl(sock,F_SETFL,opts)<0) {    // 设置文件描述符状态
        perror("fcntl(sock,SETFL,opts)");
        exit(1);
    }
}

非阻塞的接口相比于阻塞型接口的显著差异在于,在被调用之后立即返回。当用户进程发出 read() 操作时,如果 kernel 中的数据还没有准备好,那么它并不会阻塞用户进程,而是立刻返回一个结果。用户进程判断结果是一个 error 时,它就知道数据还没有准备好,于是它可以先做点别的,过一会再进行 read() 操作。一旦 kernel 中的数据准备好了,并且又再次收到了用户进程的 system call,那么它马上就将数据拷贝到了用户内存,然后返回。

所以,在非阻塞式 I/O 中,用户进程其实是需要不断的主动询问 kernel 数据准备好了没有。

在非阻塞状态下,recv()read() 接口在被调用后立即返回,返回值代表了不同的含义:

  • 返回值大于 0,表示接受数据完毕,返回值即是接受到的字节数;
  • 返回 0,表示连接已经正常断开,可以 close 掉这个连接套接字了;
  • 返回 -1,且 errno 等于 EAGAIN,表示读取操作未完成,接收缓冲区暂时无数据可读;
  • 返回 -1,且 errno 不等于 EAGAIN,表示 recv 操作遇到系统错误,错误值记录在 errno 中。

I/O 复用

这种 I/O 方式也称为事件驱动 I/O。它的好处就在于单个进程就可以同时处理多个网络连接的 I/O。它的基本原理就是 select/poll/epoll 这个方法会不断的轮询所负责的所有 socket 描述符,当某个 socket 有数据到达了,就通知用户进程,用户再调用 recv()/read(),就不会阻塞在 I/O 上了。

这部分的介绍见之前的总结《并发编程与 IO 复用》

I/O 复用其实也是阻塞的,只不过不是阻塞在 I/O 读取上,而是阻塞在 select/poll/epoll 调用上。反正最终都会导致用户的进程阻塞,那么阻塞在哪到底有什么意义呢?
复用最大的好处还是能处理更多的套接字,进程阻塞等待所有套接字中的人一个变为可读即解除阻塞。也不需要像同步非阻塞 I/O 一样你自己处理轮询的逻辑。如果场景中不会有大量连接,那么复用当然也就没意义。

信号驱动

进程预先告知内核,使得当某个 socket fd 有事件发生时,内核使用信号通知相关进程。这个信号与一个信号处理函数绑定,在信号处理函数内执行 I/O 操作。

信号驱动的作用在于在等待 I/O 可用的过程中可以执行其它的指令。这种方法从理论上看是不错,由于进程已经休眠,就不会再占用 CPU,仅当 I/O 可用时它才恢复执行。但是这种方法的问题在于信号处理的开销有点大。若只是少数的请求还没有问题,若是每分钟收到 100 个请求,那就几乎一直都在捕获信号。每秒钟捕获上百个信号的开销是相当大的,不单是进程,对于内核发送信号的开销而言也是一样的。

因此,在高性能的服务器编程中,用异步 I/O 来处理多个 I/O 更为高效。当然,也可以用 I/O 复用模型来实现(epoll 是一个相当高效的方法),但是对于 Regular File 来说,是不能使用 epoll 的,因为不能设置非阻塞模式(O_NOBLOCK 方式对于传统文件句柄是无效的,但 epoll 的边缘触发模式必须设置为非阻塞)。

异步 I/O

用户进程发起读请求之后,立刻就可以开始去做其它的事。

从 kernel 的角度,当它收到一个异步读请求之后,首先它会立刻返回,所以不会对用户进程产生任何阻塞。然后,kernel 会等待数据准备完成,将数据拷贝到用户内存。当这一切都完成之后,kernel 会给用户进程发送一个 signal,告诉它读操作完成了。

信号驱动 I/O 和异步 I/O 比较容易混淆,信号驱动虽然也是异步的但它不同于我们所说的异步 I/O(意思是说信号驱动的 I/O 过程仍然不是异步的),这两者的过程其实看操作系统到底替应用程序做了哪些事就能分辨出来:

模型 内核 进程
信号驱动 I/O 模型 发送信号:I/O 能用了 接收到 I/O 能用的信号并执行接下来的操作
异步 I/O 模型 等待这个 I/O 有消息了,接受到数据 从缓存中得到数据直接处理
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,884评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,212评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,351评论 0 360
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,412评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,438评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,127评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,714评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,636评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,173评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,264评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,402评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,073评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,763评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,253评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,382评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,749评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,403评论 2 358