背景
- Node在V8引擎之上构建,其模型与浏览器类似,js将会运行在单个进程的单个线程上;
- 好处:程序状态是单一的,不存在多线程情况下的锁、线程同步的问题,操作系统在调度时因为较少上下文的切换,可以很好的提高cpu的使用率;
- 缺点
- 如今CPU基本是多核的,一个Node进程只能用一个核 -> 如何充分利用多核cpu服务器?
- Node执行在单线程上,一旦单线程上抛出的异常没有被捕获,将会引起整个进程的崩溃 -> 如何保证进程的健壮性核稳定性?
- Node并非真正的单线程架构,其自身还有一定的IO线程存在,这些IO线程由底层libuv处理,对js开发者是透明的,只在c++扩展开发时才会关注到 -> js代码永远运行在V8上,是单线程的。
注:,由于一个CPU核心在 一个时刻只能做一件事情,操作系统只能通过将CPU切分为时间片的方法,让线程可以较为均匀地使用CPU资源,但是操作系统内核在切换线程的同时也要切换线程的上下文,当线程数量过多时, 时间将会被耗用在上下文切换中。
多进程架构
-
child_process模块:支持Node随意创建子进程的能力;
(1)创建异步子进程:返回一个ChildProcess实例,允许父进程注册监听器函数,在子进程生命周期期间,当特定事件发生时会调用这些函数;
- spawn(command[, args]):使用给定的command和args中的命令行参数衍生一个新进程;
- exec(command[, options][, callback(err, stdout, stderr)]):衍生一个shell并在shell中执行命令command,且缓冲任何产生的输出,有一个回调函数获知子进程的状况;
- execFile(file[, callback]):衍生出一个新进程来执行file(文件名/路径);
- fork(modulePath):衍生新的nodejs进程,每个进程都有自己的内存,使用自己的V8实例;
注:可执行文件是指可以直接执行的文件,若js文件通过execFile()运行,它的首行内容必须添加:#!/usr/bin/env node;
(2)进程间通信
创建子进程之后,父子进程之间会创建IPC(进程间通信:双向通信,在系统内核中完成进程的通信,而不用经过实际的网络层)通道—pipe技术(libuv提供),通过IPC,父子进程之间才能通过message()和send()传递消息—相互访问资源并进行协调工作;
IPC通道被抽象为Stream对象,在调用send()时发送数据,接收到的消息会通过message事件触发给应用层;
- 父进程先创建IPC通道并监听他;
- 再创建出子进程,通过环境变量(NODE_CHANNEL_FD)告诉子进程这个IPC通道的文件描述符;
- 子进程(只能是Node进程)启动的过程中,根据文件描述符去连接这个已存在的IPC通道,从而完成父子进程之间的连接;
(3)句柄传递
端口被占用时,新的进程不能继续监听该端口了—多个进程不能监听同一个端口,解决方案:
-
代理方案:
- 通过代理避免端口不能重复监听的问题:主进程监听主端口,对外接收所有的网络请求,再将这些请求分别代理到不同的端口的进程上:
- 负载均衡:使每个子进程可以较为均衡地执行任务;
代理方案的问题:客户端连接到代理进程,代理进程连接到工作进程会用掉两个文件描述符 — 浪费掉一倍数量的文件描述符;
-
句柄方案:进程间通过send()的第二个参数发送句柄—标识资源(服务器socket对象、客户端socket对象、UDP套接字、管道)的引用;
- 主进程接收到socket请求后,将这个socket直接发送给工作进程,而不是重新与工作进程之间建立新的socket连接来传送数据;
注:最后一种结构说明多个子进程可以同时监听相同端口,没有出现异常发生— 多个应用监听相同端口时,文件描述符同一时间只能被某个进程所用,即网络请求向服务器发送时,进程服务是抢占式的,只有其中一个能为这个请求进行服务;
端口共同监听:独立启动的进程中,TCP服务端socket套接字的文件描述符并不相同,导致监听到相同的端口时会抛出异常;而通过fork时,使用句柄传递时套接字socket的文件描述符是相同的了;
- 主进程接收到socket请求后,将这个socket直接发送给工作进程,而不是重新与工作进程之间建立新的socket连接来传送数据;
-
Cluster模块:创建Node进程集群,解决多核CPU的利用率问题;
(1)Cluster工作原理:child_process模块+net模块;
cluster中主进程用来创建工作进程,工作进程创建并共享一个TCP/HTTp服务器(工作进程可以共享任何tcp连接)
在cluster.fork()子进程时,将这个tcp服务器端socket文件描述符发送给工作进程,对于cluster.fork()复制出来的子进程,它的环境变量就存在NODE_UNIQUE_ID变量,若工作进程(子进程)存在listen()侦听网络端口的调用时,拿到文件描述符,通过SO_REUSEADDR端口重用,实现多个子进程共享端口;
(2)cluster模块和child_process模块的区别
- 获取进程的pid
- cluster:worker.process.pid;
- child_process:worker.pid;
- 管理的工作进程:
- cluster:一个主进程只能管理一组工作进程;
- child_process:一个主进程可以控制多组进程;
- 判断Node进程集群中主进程和子进程:cluster.isMaster/cluster.isWorker;其原理:取决于环境变量中是否存在NODE_UNIQUE_ID;