在学习 Node 的时候,一定会被告知 Node 是基于 Event Loop 的,以及事件驱动、事件队列、非阻塞 IO 等概念,最终得出一个结论:Node 非常适合 IO 密集型的应用,能够以很少的资源消耗实现高并发。
但为什么 Event Loop 架构可以实现较高的并发呢?这个问题我一直也不明白,于是我在网上查了一些文章,大概明白了一点,便进行整理,方便以后查看。
场景模拟
我们来模拟一个典型的请求-响应模型:客户端向服务器发起请求,服务端收到请求后对请求进行处理,然后进行数据库读取,最后将读取的结果进行响应。示例图如下:
在这个模型中,会经过三个阶段:
- 服务器收到请求并处理
- 读取数据库
- 服务器处理数据并响应
在这三个阶段中,第一个阶段和最后一个阶段会由 CPU 进行计算,第二个阶段则是 IO 操作,只占用极少的 CPU。
我们假定这三个阶段各耗时 1ms,因此服务器处理每个请求所花的时间就为 3ms。
假如我们的服务器是单核 CPU,并只有一个线程,那么每秒钟可以处理的请求约等于 333 个,也就是服务器的 QPS 等于 333。
QPS 可以用来客观描述服务器的并发能力,QPS 越大,服务器的并发能力越好。
单核单线程的情况
假定我们的服务器是单核单线程的,那么其处理情况如下所示:
服务器收到了两个请求:请求1和请求2。处理流程如下:
- 收到请求1,进行处理
- 读取数据库,由于是单线程,CPU 需要等待 IO 读取完成再进行后面的操作
- 处理读取到的数据,响应客户端
- 按上面的流程继续处理请求2
单线程的瓶颈在于无法充分利用 CPU 资源,在进行 IO 读取时,CPU 实际上是处于空闲状态,必须等待 IO 读取完成再进行后面的处理。对于每个请求,CPU 都会有一个较大的等待时期。在单线程模型下,服务器的 QPS 为 333。
单核多线程的情况
假定我们服务器是单核 CPU,但是开启了两个线程,其处理情况如下所示:
采用单核多线程时,情况就不一样了,对于请求1和请求2,将由两个不同的线程进行处理,流程如下:
- (线程1)收到请求1的请求进行处理
- (线程1)请求1开始 IO 读取,CPU 空闲
- (线程2)CPU 切换到请求2所在的线程,并进行请求处理
- (线程2)请求2开始 IO 读取,CPU 空闲
- (线程1)请求1的 IO 读取完毕,CPU 切换到请求1所在的线程,处理数据并响应客户端,CPU 空闲
- (线程2)请求2的 IO 读取完毕,CPU 切换到请求2所在的线程,处理数据并响应客户端,CPU 空闲
- 按照上面的流程进行请求3和请求4的处理
在多线程的模型下,由于 CPU 不用等待 IO 读取完成,其核心得到了充分的利用,在这个模型下,处理完两个请求所耗时为 4ms,平均处理一个请求所耗时为 2ms,QPS 为 500,并发能力比单线程模型好多了。
多线程模型的问题
多线程模型最大的问题,莫过于线程上下文切换所带来的额外开销了。上面展示的情况,是没有上下文切换下的理想情况,但在真实的环境下,两个线程间进行切换,必定会产生开销的,而且还不小。因此上面的处理情况可能是这样:
因此,由于频繁上下文切换造成的开销,上面的多线程模型的并发能力比理想情况下要弱。
单线程异步 IO 的情况
在多线程模型中,通过使用线程切换,避免了 CPU 因等待 IO 操作的闲置,最大程度上利用了 CPU 资源,但是线程间的频繁上下文切换也会产生很大的开销,同样会增加服务器的压力。因此,要想避免线程上下文切换的带来的开销,就只有使用单线程。
在使用单线程的情况下,能否实现非阻塞的 IO 呢?
上面就是一个单线程非阻塞 IO 的模型,处理请求时的流程如下:
- 收到请求1,开始处理请求
- 进行请求1的 IO 读取,并注册一个回调函数(处理数据并响应客户端),同时线程不阻塞,继续处理请求2
- 进行请求2的 IO 读取,并注册一个回调函数(处理数据并响应客户端),同时线程不阻塞,继续处理剩下的请求
- 请求处理结束后,依次执行 IO 读取是注册的回调函数(处理数据并响应客户端),完成处理
假设服务器只接受到两个请求:请求1和请求2,按照上面的流程图,处理这两个请求的时间为 4ms,平均每个请求用时 2ms,此时服务器的 QPS 为 500。由于是单线程运行,没有频繁上下文切换带来的开销,因此这个单线程异步 IO 的模型比多线程模型占用的资源更少,对服务器配置要求更低。同时,从流程图也可以看到,这种架构具备很大的吞吐能力,十分适合 IO 密集型的应用。
总结
本文对几种常见的任务处理模型:单线程模型、多线程模型、单线程非阻塞 IO 模型进行了对比,依据是应用这些模型时的服务器 QPS 值,得出的结论是单线程非阻塞 IO 模型具备较强的并发处理能力,且占用更少的资源。
Node 的 Event Loop 基于这种单线程非阻塞 IO 模型,因此具备强大的并发能力,适合 IO 密集型的应用(如游戏、电商秒杀活动等)。
附:参考资料
Node.js为什么快
JavaScript 运行机制详解:再谈Event Loop
【朴灵评注】JavaScript 运行机制详解:再谈Event Loop
理解Node.js的event loop
完。