不定期更新中。
最近用node来处理几个长链接问题,用来替换php-fpm,php什么都好,就是维持长链接有问题,如果php-fpm被占用的太多,长时间不响应,则会爆出:
WARNING: [pool www] server reached pm.max_children setting (50), consider raising it
而Node则擅长维持长链接。
字符串的 split(separator, limit)
函数(其实是javascript
语言的坑)
split
函数用来将字符串按照第一个参数separator
来分割(可以是字符串或正则表达式),返回分割后的数组,第二个参数limit
,用来限制分割后返回的数组数量,这个参数和其他所有已知人类的编程语言都不一样
,他并不是用来限定
分割次数的,而是,先把字符串全部分割,分割完成后,取前limit个元素。比如把 str
字符串变量以空格
分割:
str.split(' ', 2);
相当于 str.split(' ').slice(0,2);
这简直是我见到过最丑陋的函数!简直可以称为世界之最奇葩!
因为有很多的场合下,其实只想限定分割次数,比如这样一串字符串:"user-agent: Mozilla/5.0, OS: Mac, Arch: amd64",我只想用正则/:\s+/
来分割一次,后面的就别割了。
先看看人类的编程语言们,怎么处理split限定次数,比如Ruby:
2.2.2 :032 > "user-agent: Mozilla/5.0, OS: Mac, Arch: amd64".split(/:\s+/, 2)
=> ["user-agent", "Mozilla/5.0, OS: Mac, Arch: amd64"]
很好,返回的很正常,后面的确实没有割。
在看看js返回:
> "user-agent: Mozilla/5.0, OS: Mac, Arch: amd64".split(/:\s+/, 2)
[ 'user-agent', 'Mozilla/5.0, OS' ]
马德,OS后面的被吞掉了!
于是你只能不要后面这个参数,但是还是不行:
> "user-agent: Mozilla/5.0, OS: Mac, Arch: amd64".split(/:\s+/)
[ 'user-agent', 'Mozilla/5.0, OS', 'Mac, Arch', 'amd64' ]
这根本不是想要的,如果仅仅是用字符串来分割,可以把后面的join(': ')
一下,但对于正则,解决起来就没有这么简单了,抽空写了一个npm split-limit 包,后来发现有人早就写过了:strsplit 功能差不多。
对象赋值为引用
js中,传递的对象,除基本类型Boolean
、String
、Number
、Undefined
、Null
外,其他类型都是引用,这个虽然是js的入门课,但在项目中,尤其是Node这种Daemon性质的代码中,不注意的话危害很大。
看一段样例代码,有一个http请求封装的函数,每次请求前,用全局的g_headers
变量来初始化request的headers,然后再根据传递的参数复写headers
var URL = require('url');
var g_headers = {
'Cache-Control': 'no-cache',
'Accept': '*/*',
'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10.10; rv:34.0) Gecko/20100101 Firefox/40.0'
};
function node_fetch(method, url, param, headers) {
var options = URL.parse(url);
options.headers = g_headers; // 问题代码,应该用 for(var k in g_headers) 来挨个初始化
for(var k in headers){
options.headers[k] = headers[k];
}
// request 代码
}
这个函数存在非常大的问题,因为将 g_headers
赋值给了 options.headers
时候,是引用,所以对options.headers
的任何改变都会改变全局变量 g_headers
,调用多次后,g_headers
已经面目全非了。
Node.js httpServer维持长链接
Node.js创建一个httpServer非常简单,官方例子:
const http = require('http');
const hostname = '127.0.0.1';
const port = 3000;
const server = http.createServer((req, res) => {
res.statusCode = 200;
res.setHeader('Content-Type', 'text/plain');
res.end('Hello World\n');
});
server.listen(port, hostname, () => {
console.log(`Server running at http://${hostname}:${port}/`);
});
但是我测试长链接的时候,基本上在2分钟左右被强制断开了,后来才查询到,官方文档:
server.timeout
<Number> Default = 120000 (2 minutes)
所以需要在维持长链接的http server中增加timeout值:
server.timeout = 10*60*1000; // 10分钟
Node.js响应中文
Node.js响应代码中,输出中文会有问题,常见到的代码是这样:
var headers = {
'Content-Type': 'text/plain; charset=utf-8',
'Content-Length': body.length // 很多样例代码这样写 body.length
};
res.writeHead(200, headers);
res.write(body);
res.end();
这段代码的问题是,js对于unicode、中文字符 length返回的是实实在在的字符个数,而不是存储的字节量,而中文值utf-8中是3个字节存储的,还有emoji表情则是4个字节,但content-length指定的应该是响应内容的字节码数量,所以会造成接收端接收不到完整的响应数据,从而出现乱码。
解决代码,用 Buffer.byteLength
替换 length
:
var headers = {
'Content-Type': 'text/plain; charset=utf-8',
'Content-Length': Buffer.byteLength(body, 'utf8') // 这里不能为 body.length
};
res.writeHead(200, headers);
res.write(body);
res.end();