一.阻塞 I/O
对于使用阻塞式I/O 的 web server,不能在同一个线程中同时处理多个connections。每一个I/O 操作都会阻塞其它的connection。所以传统处理并发的web server,一般采取多线程或一个进程(或在进程池中重用一个taken),这样,当一个线程被I/O操作阻塞时,不会影响其他的请求,因为它们采用分开的线程的处理方式。
缺点:- 当与数据库或filesystem交互时,我们需要等待操作完成的结果
- 线程对于系统资源的花销是很昂贵,这样并不是很效率
二.非阻塞式 I/O
除了上面的阻塞式I/O,现在的操作系统都支持另一种访问资源的方式,叫做非阻塞 I/O。系统永远立即返回,而不用等待数据被读取或写入。如果在调用时没有结果可以获取,函数将返回预先定义的常量,表示当时没有数据可获取。
最基本的实现非阻塞式I/O的方式是,通过轮询资源(polling loop),直到实际的数据被返回,这种方式称之为busy-waiting
,但是这样做会消耗大量CPU资源,所以并不效率。
三.事件多路分解器(Event demultiplexing)
上面介绍的Busy-waiting 很明显不适合处理非阻塞资源。幸运的是,现在操作系统提供了一种原生的,高效率的处理并发,非阻塞资源的方法,称之为 同步事件多路分解器(synchronous event demultiplexer) 或 事件通知接口(event notification interface)。
这个组件收集和队列一系列来自被观察资源的 I/O事件,并且屏蔽它们,直到新的事件能够处理。
伪代码过程:
socketA, pipeB;
watchedList.add(socketA, FOR_READ); // [1]
watchedList.add(pipeB, FOR_READ);
while(events = demultiplexer.watch(watchedList)) { // [2]
// 事件循环
foreach(event in events) { // [3]
// 这个read方法,永远不会被阻塞
// 并且永远返回数据
data = event.resource.read();
if (data === RESOURCE_CLOSED) {
// 资源被关闭,则将其从观察列表中移除
demultiplexer.unwatch(event.resource);
} else {
// 一些实际的数据被接受并被处理
consumeData(data);
}
}
}
伪代码中比较重要的步骤:
-
[1]: 资源和相应的特定操作(例如
read
操作)添加到数据结构中 -
[2]: 事件通知器设置一系列资源被观测。这个调用是同步的,阻塞的,知道任何被观测的资源被
read
。当这发生时,事件多路分解器从调用中返回,并且新的一系列事件能够被处理 - 被事件分解器处理的每个事件被返回。资源和相应的事件确保准备读取,这个操作是非阻塞的。当事件被处理,这个工作流再次阻塞直到新的事件重新可以被处理。这个过程称之为 event loop
四.反应堆模式(Reactor pattern)
主要思想是,通过handler(在Node.js中以 callback
函数表示)结合每个 I/O 操作,当事件产生并且通过事件循环处理时,这个handler将被调用。结构如下:
上图即是应用使用反应堆模式时的状态:
1.应用通过提交请求到Event Demultiplexer产生新的I/O操作。应用同时指定handler,当操作完成时调用(即回调函数)。提交新的请求到Event Demultiplexer是一个非阻塞调用,它立即返回control到应用
2.当一系列的I/O操作完成,Event Demultiplexer将新的事件添加到事件队列(Event Queue)中
3.此时 Event Loop迭代 事件队列 中的 items
4.对于每个event,相应的handler被调用
5.handler执行完毕之后,将返回control到event loop中(5a);然而,在执行handler的过程中,新的异步操作可能被请求(5b),在control返回到event loop之前, 引起新的操作被插入到Event Demultiplexer(第1步)中
6.当Event Queue中所有的项目被被处理,这个循环将重新阻塞在Event Demultiplexer,知道一个新的事件的到来。
总结: reactor pattern通过阻塞来处理I/O,知道来自一组被观察资源的新事件可用,然后通过将每个事件分派到相关联的处理程序来做出反应。
NodeJS底层通过C语言库 libuv
来兼容主流平台和
规范不同类型资源的非阻塞行为。libuv现在用于表示Node.js底层的I/O引擎。libuv介绍
NodeJS底层架构:
总结
主要涉及Node.js的一些基本概念:
- 事件多路分解器(Event demultiplexer)
- 非阻塞I/O操作
- 事件队列Event Queue
- Reactor pattern: 异步的特点,通过回调函数的方式来消除线程和竞态的担忧
- event loop