本章导读
NodeJS发展史
2009年5月, Ryan Dahl在GitHub上发布了基于V8引擎的NodeJS最初的ྟ本。目前NodeJS的官方网站是: http://nodejs.org。NodeJS还符合高性能Web服务器的设计要求:事件驱动和非阻塞IO,因此,得到了极大的推崇和发展。
注意:V8是JS引擎,webkit是布局引擎。因此,node与前端js一样,也是基于作用域和原型链的。
Node的特点
异步IO
我们来看一个异步IO的例子
var fs = require('fs');
fs.readFile('/path', function (err, file) {
console.log('读完文件ྜ成')
});
console.log('开始读文件');
异步IO比同步IO消耗更少的时间(因为,异步IO可以让多个任务同时在多个进程中处理,同步IO只有完成一个任务处理之后,才会进行下一个任务),更大限度的使用CPU的资源。
事件与回调函数(callback)
事件编程的好处是只关注事务,确保程序在正确的时间执行。同时,通过回调函数,将各个事件之间关联起来。
跨平台
WIN、*inx、MacOS上都能用
单线程
每个Node实例都是单线程处理程序的,不同线程之间无法共享状态。因此,不存在线程锁(死锁也就不存在喽)和上下文线程交换所带来的性能上的开销。
相应的缺点就是,单一node实例无法利用多核cpu,程序健壮性需要控制,防止因为一个错误造成整个服务的宕机,大量占用cpu的操作可能会引起异步io无法执行。不过,这个是以前的情况了,现在通过反向代理、负载均衡、clustor、web wokers等可以最大限度的降低这些问题的发生。
nodejs还提供了与web workers相同的思路的解决方案,child_process(子进程,将计算分发到子进程,可以将大量的计算分解掉。然后,再通过进程间的事件消息来传递结果,这可以很好地保持应用模型的简单和低依赖。这就是Master-Worker的管理方式,这个方式很好地管理各个工作进程,创造出更好的程序健壮性。)
Node的应用场景
IO密集型
因为事件驱动和异步IO,因此,对于IO的吞吐量是巨大的。
CPU密集型
其实Node挺快的了,还可以通过扩展C/C++模块,来提升性能。
这里我们通过分析不同语言在执行菲波那切数列(F0=0,F1=1,Fn=F(n-1)+F(n-2)(n>=2))的效率和性能,来说明一下。(此处设置n=40,这个测试主要偏重于cpu栈操作,其中,c和go都是静态语言,用于参考)
通过这个表格,我们可以看出,node也具有优秀的cpu计算能力,这个能力主要来源于V8引擎的深度优化,也就是说通过对于node内核的C/C++的调优,node是可以获得非常牛的运算能力的。(其实,关于cpu密集型的运算在node上存在这样一个问题,因为,node是单线程的,如果长时间运行技术,例如大的循环,将会导致cpu时间片不能释放,使得后续IO无法发起,但是可以通过适当调整和分解大型运算任务,将其分解为一个个小的运算,使得运算能够适时释放,不阻塞IO调用的发起就可以了)
综上所述,node解决cpu密集型问题也有两个方案
方案一:通过编写C/C++扩展的方式更高效的利用CPU,将一些V8不能做到性能极致的地方通过C/C++来实现。
方案二:启用子进程,将一部分node进程当做常驻服务进程用于计算,然后利用进程间的消息传递结果,将计算与IO分离,这样还可以更进一步的压榨CPU。
另外,在第四章,作者简单介绍了如何拆分和调度任务以到达将大任务拆分的目的,也就是:如何分解任务的方法来应对cpu密集型的程序:(这部分内容在第四章的笔记中也有写,此处做一个冗余处理)
由于事件循环模型需要应对海量请求,海量请求同时作用在单线程上,就需要防止任何一个计算耗费过多的cpu时间片。至于是计算密集型,还是IO密集型,只要计算不影响异步IO的调度,那就不构成问题。建议对cpu的耗用不要超过10ms,或者将大量的计算分解为诸多的小量计算,通过setImmediate()进行调度。只要合理利用node的异步模型与V8的高性能,就可以充分发挥cpu和IO资源的优势。
与遗留系统和平相处
用node做个中间层。
分布式应用
阿里巴巴的数据平台对Node的分布式应用算是一个典型的例子。分布式应用意味着对可伸缩性的要求非常高。数据平台通常要在一个数据库集群中去寻找需要的数据。阿里巴巴开发了中间层应用NodeFox、ITier,将数据库集群做了划分和映射,查询调用依旧是针对单张表进行SQL查询,中间层分解查询SQL,并行地去多台数据库中获取数据并合并。NodeFox能实现对多台MySQL数据库的查询,如同查询一台MySQL一样,而ITier更强大,查询多个数据库如同查询单个数据库一样,这里的多个数据库是指不同的数据库,如MySQL或其他各种类型的数据库。这个案例也是高效利用并行IO地例子,也是高效使用数据库的过程。对于node来说只是一次普通的IO,对于数据库而言,却是一次复杂的计算,所以也是进而充分压榨硬件资源的过程。
基于socket.io的长连接应用
例如游戏服务器、即时通讯服务器。