Node.js(javascript)踩的那些坑

不定期更新中。
最近用node来处理几个长链接问题,用来替换php-fpm,php什么都好,就是维持长链接有问题,如果php-fpm被占用的太多,长时间不响应,则会爆出:
WARNING: [pool www] server reached pm.max_children setting (50), consider raising it
而Node则擅长维持长链接。

字符串的 split(separator, limit)函数(其实是javascript语言的坑)

split函数用来将字符串按照第一个参数separator来分割(可以是字符串或正则表达式),返回分割后的数组,第二个参数limit,用来限制分割后返回的数组数量,这个参数和其他所有已知人类的编程语言都不一样,他并不是用来限定分割次数的,而是,先把字符串全部分割,分割完成后,取前limit个元素。比如把 str字符串变量以空格分割:
str.split(' ', 2); 相当于 str.split(' ').slice(0,2);
这简直是我见到过最丑陋的函数!简直可以称为世界之最奇葩!
因为有很多的场合下,其实只想限定分割次数,比如这样一串字符串:"user-agent: Mozilla/5.0, OS: Mac, Arch: amd64",我只想用正则/:\s+/来分割一次,后面的就别割了。
先看看人类的编程语言们,怎么处理split限定次数,比如Ruby:

2.2.2 :032 > "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
 => ["user-agent", "Mozilla/5.0, OS: Mac, Arch:  amd64"] 

很好,返回的很正常,后面的确实没有割。
在看看js返回:

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/, 2)
[ 'user-agent', 'Mozilla/5.0, OS' ]

马德,OS后面的被吞掉了!
于是你只能不要后面这个参数,但是还是不行:

> "user-agent: Mozilla/5.0, OS: Mac, Arch:  amd64".split(/:\s+/)
[ 'user-agent', 'Mozilla/5.0, OS', 'Mac, Arch', 'amd64' ]

这根本不是想要的,如果仅仅是用字符串来分割,可以把后面的join(': ')一下,但对于正则,解决起来就没有这么简单了,抽空写了一个npm split-limit 包,后来发现有人早就写过了:strsplit 功能差不多。

对象赋值为引用

js中,传递的对象,除基本类型BooleanStringNumberUndefinedNull外,其他类型都是引用,这个虽然是js的入门课,但在项目中,尤其是Node这种Daemon性质的代码中,不注意的话危害很大。
看一段样例代码,有一个http请求封装的函数,每次请求前,用全局的g_headers变量来初始化request的headers,然后再根据传递的参数复写headers

var URL = require('url');
var g_headers = {
  'Cache-Control': 'no-cache',
  'Accept': '*/*',
  'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:34.0) Gecko/20100101 Firefox/40.0'
};
function node_fetch(method, url, param, headers) {
  var options = URL.parse(url);
  options.headers = g_headers; // 问题代码,应该用 for(var k in g_headers) 来挨个初始化
  for(var k in headers){
    options.headers[k] = headers[k];
  }
  // request 代码
}

这个函数存在非常大的问题,因为将 g_headers 赋值给了 options.headers 时候,是引用,所以对options.headers的任何改变都会改变全局变量 g_headers,调用多次后,g_headers 已经面目全非了。

Node.js httpServer维持长链接

Node.js创建一个httpServer非常简单,官方例子:

const http = require('http');

const hostname = '127.0.0.1';
const port = 3000;

const server = http.createServer((req, res) => {
  res.statusCode = 200;
  res.setHeader('Content-Type', 'text/plain');
  res.end('Hello World\n');
});

server.listen(port, hostname, () => {
  console.log(`Server running at http://${hostname}:${port}/`);
});

但是我测试长链接的时候,基本上在2分钟左右被强制断开了,后来才查询到,官方文档:
server.timeout
<Number> Default = 120000 (2 minutes)
所以需要在维持长链接的http server中增加timeout值:

server.timeout = 10*60*1000; // 10分钟

Node.js响应中文

Node.js响应代码中,输出中文会有问题,常见到的代码是这样:

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': body.length  // 很多样例代码这样写 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();

这段代码的问题是,js对于unicode、中文字符 length返回的是实实在在的字符个数,而不是存储的字节量,而中文值utf-8中是3个字节存储的,还有emoji表情则是4个字节,但content-length指定的应该是响应内容的字节码数量,所以会造成接收端接收不到完整的响应数据,从而出现乱码。
解决代码,用 Buffer.byteLength 替换 length

var headers = {
  'Content-Type': 'text/plain; charset=utf-8',
  'Content-Length': Buffer.byteLength(body, 'utf8')  // 这里不能为 body.length
}; 
res.writeHead(200, headers);
res.write(body);
res.end();
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • Spring Cloud为开发人员提供了快速构建分布式系统中一些常见模式的工具(例如配置管理,服务发现,断路器,智...
    卡卡罗2017阅读 136,265评论 19 139
  • https://nodejs.org/api/documentation.html 工具模块 Assert 测试 ...
    KeKeMars阅读 11,557评论 0 6
  • 1. Java基础部分 基础部分的顺序:基本语法,类相关的语法,内部类的语法,继承相关的语法,异常的语法,线程的语...
    子非鱼_t_阅读 33,734评论 18 399
  • 第1章 认识JS JavaScript能做什么?1.增强页面动态效果(如:下拉菜单、图片轮播、信息滚动等)2.实现...
    mo默22阅读 5,259评论 0 5
  • 曾几何时我是一个很相信别人的人,特别是比较亲近的人,但是人都是自私的。很多时候他们所谓的承诺,只是为了让你实现他的...
    照见山居阅读 3,414评论 0 1

友情链接更多精彩内容