V8引擎是目前JavaScript最流行的引擎, 它为JavaScript可以高效的运行在浏览器和Nodejs这两大宿主环境中提供了极致的保驾护航。V8引擎正努力降低整体的内存占用和提升更高的性能。其中V8垃圾回收机制在JavaScript代码执行的整个生命周期中采取垃圾回收策略来减少内存占用是需要了解认识的。 当然这部分的只是并不太影响我们写代码的流程, 毕竟在一般情况下我们很少会遇到浏览器出现内存溢出而导致程序崩溃的情况。 但是了解垃圾回收机制能增强我们在写代码过程中对减少内存占用, 避免内存泄漏的主观意识,也能帮助写出更加健壮和对V8引擎更加友好的代码。
一、 垃圾为何需要回收
V8引擎在执行代码过程中, 当遇见函数时会为其创建一个函数执行上下文Context
并添加到调用栈的栈顶, 函数的作用域handleScope
中包含了该函数中声明的所有变量, 当该函数执行完毕后,对应的执行上下文从栈顶弹出,函数的作用域会随之销毁, 其包含的所有变量也会随之释放并被自动收回。 试想,如果在这个作用域被销毁的过程中,其中的变量不被收回,持久占用内存,那么会必然导致内存暴增,从而引发内存泄漏,程序的性能直线下降甚至崩溃。 因此内存在使用完毕之后理当归还给操作系统以保证内存的重复利用。
但是JavaScript 作为一门高级语言, 并不像C、C++ 一样需要手动的申请和释放内存, V8引擎已经帮我们自动进行了内存的分配和管理, 好让我们有更多的精力去专注于业务的复杂逻辑, 这对于前端开发来说无疑是一项福利。 但是随之带来的问题也是显而易见的, 那就是由于不去手动管理内存, 导致写代码的过程中不够严谨从而容易引发内存泄漏。
二、V8引擎的内存限制
V8引擎实现了自动的垃圾回收管理, 但是在V8引擎中内存的使用并不是无限制的。 默认情况下64位操作系统最多只能使用约 1.4GB的内存, 32位 最多只能使用0.7GB内存。 在这样的限制下, 必然会导致node中无法直接操作大内存对象。 V8引擎设计之初是作为浏览器端JavaScript的执行环境, 在浏览器端使用大量内存的场景很少,因此也就没有必要将最大内存设置得过高。另外两个主要的原因:
JS单线程机制:
作为浏览器的脚本语言, JS的主要用途是与用户交互及其操作DOM, 这也决定其作为单线程的本质, 单线程意味着执行代码必须按照顺序执行, 在同一时间只能处理一个任务。 试想,如果JS是多线程的,一个线程在删除DOM元素的同时, 另一个线程对该元素进行修改操作, 那么必然会导致复杂的同步问题。 既然JS是单线程的,也就意味着V8在执行垃圾回收时, 程序中的其他各种逻辑都要进入暂时等待阶段,知道垃圾回收结束后才会再次重新执行JS逻辑。因此,由于JS的单线程机制,垃圾回收的过程阻碍了主线程逻辑的执行。
由于HTML5 引入了新的Web Worker标准,其作用就是为JS创造多线程环境,允许主线程创建Worker并分配一些任务运行,再把结果返回给主线程,这样的好处是,一些计算密集或高延迟的任务被Worker分担,主线程就会很流程, 不会被阻塞或拖慢。 Web Worker不是JS的一部分, 而是通过JS访问的浏览器特性, 其虽然创造了多个执行环境, 但是子线程完全不受主线程控制, 不能访问浏览器特定的API, 例如操作DOM, 因此这个新标准并没有改变JS单线程的本质。
垃圾回收机制:
垃圾回收本身也是一件非常耗时的操作, 假设V8的堆内存为1.5G, 那么V8做一次小的垃圾回收需要50ms以上, 而做一次非递增式回收甚至需要1s以上,可见其耗时之久, 而在这1s的事件内,浏览器一直处于等待的状态, 同时会失去对用户的响应, 如果有动画正在运行, 也会造成动画卡顿掉帧的情况,严重影响程序的性能。 因此内存使用过高必然会导致垃圾回收过程缓慢,主线程等待的时间越长, 浏览器也就越长时间得不到响应。
基于以上两点, V8引擎为了减少对应用的性能造成印象, 采用了一种比较粗暴的手段,那就是直接限制堆内存的大小, 毕竟在浏览器端一般也不会遇到需要操作几个G内存的场景。 但是在node端,设计到的I/O操作可能会比浏览器更加的复杂多样, 因此更有可能出现内存溢出的情况。 不过也没关系, V8提供了可配置项可以手动地调整内存大小, 需要在node初始化的时候进行配置。
三、V8的垃圾回收策略
V8的垃圾回收策略主要基于 分代式垃圾回收机制
, 其根据 对象的存活时间 将内存的垃圾回收进行不同的分代, 然后对不同的分代采用不同的垃圾回收算法。
四、如何避免内存泄漏
浏览器和大部分前端框架在底层已经处理了常见的内存泄漏问题, 但是还是有必要了解常见的几种避免内存泄漏的方式:
1. 尽可能少的创建全局变量
在ES5中以var
在全局作用域上声明一个变量时, 或者在函数作用域中不以任何声明方式创建一个变量时, 都会无形的挂载到window
全局对象上:
var a = 1;
window.a === a;
// a 等价于 window.a
function foo() {
a = 1;
}
等价于
function foo() {
window.a = 1;
}
在foo函数中创建一个变量 a
, 但忘记使用 var
来声明, 此时会意想不到的创建一个全局变量并挂载到window对象上。
还有一种比较隐蔽的方式会创建全局变量:
function foo() {
this.a = 1;
}
foo(); 相当于 window.foo();
this.a 相当于 window.a
当foo 函数在调用时,它所指向的运行上下文环境为 window全局对象, 因此函数中的this指向的是window, 也就无意的创建一个全局变量。 当垃圾回收时, 在标记阶段因为 window对象可以作为根节点, 在window上挂载的属性均可以被访问到, 并将其标记为活动的 从而常驻内存, 因此也就不会被垃圾回收, 只有在整个进程退出时,全局作用域才会被销毁。 如果必须使用全局变量, 需要在全局变量使用完毕后将其设置为null 从而触发回收机制。
2. 手动清除定时器
setTimeout 或者 setInterval 等定时器是一个非常有用的功能, 但是我们稍不注意,忘记在适当的时间手动清湖定时器, 那么很有可能就会导致内存泄漏:
const numbers = [];
const foo = function() {
for(let i = 0;i < 100000;i++) {
numbers.push(i);
}
};
window.setInterval(foo, 1000);
由于没有手动清除定时器, 导致回调任务会不断的执行下去, 回调中所引起的变量也不会被垃圾回收, 最终导致数组长度无线递增, 从而引发内存泄漏。
3.闭包
闭包是JS中的一个高级特性, 可以实现很多高级功能,闭包的特性可以在外部作用域访问内部作用域中的变量:
function foo() {
var local = 1;
return function () {
return local;
}
}
var bar = foo();
console.log(bar()); // 1
foo函数执行完会返回一个匿名函数, 该函数内部引用了foo函数中的局部变量 local, 并且通过 变量bar 来引用这个匿名函数, 通过这种闭包的方式就可以访问foo函数外部访问不到的局部变量local。 一般情况下, foo函数执行完毕后,它的作用域会被销毁, 但是由于存在变量引用其返回的匿名函数, 导致作用域无法得到释放, 也就导致local变量无法回收, 只有取消掉对匿名函数的引用才会进入垃圾回收阶段。
4. 清除DOM引用
const elements = {
button: document.getElementById('button')
};
function removeButton() {
document.body.removeChild(document.getElementById('button'));
}
removeButton();
通过调用 removeButton 方法来清除button元素, 但是由于在 elements 字典里存在 button元素的引用, 所以及时我们通过removeButton方法移除了 button 元素, 它其实还是存储在内存中无法释放, 只有我们手动清除button元素的引用才会被垃圾回收。
5.弱引用
在Es6中新增了两个有效的数据结构WeakMap 和 WeakSet, 就是为了解决内存泄漏的问题而诞生的。 其表示 弱引用
,它的键名所引用的对象均是弱引用, 弱引用是指垃圾回收的过程中不会将键名对该对象的引用考虑进去。 只要所引用的对象没有其他的引用了, 垃圾回收机制就会释放该对象所占用的内存。 这也就意味着我们不需要关心 WeakMap
中键名对其他对象的引用, 也不需要手动的进行引用清除。(参考阮一峰ES6标准入门中的实例,手动实现):
首先打开node命令行输入以下命令:
node --expose-gc // --expose-gc 表示允许手动执行垃圾回收机制
然后执行代码:
// 手动执行一次垃圾回收保证内存数据准确
> global.gc();
undefined
// 查看当前占用的内存,主要关心heapUsed字段,大小约为4.4MB
> process.memoryUsage();
{ rss: 21626880,
heapTotal: 7585792,
heapUsed: 4708440,
external: 8710 }
// 创建一个WeakMap
> let wm = new WeakMap();
undefined
// 创建一个数组并赋值给变量key
> let key = new Array(1000000);
undefined
// 将WeakMap的键名指向该数组
// 此时该数组存在两个引用,一个是key,一个是WeakMap的键名
// 注意WeakMap是弱引用
> wm.set(key, 1);
WeakMap { [items unknown] }
// 手动执行一次垃圾回收
> global.gc();
undefined
// 再次查看内存占用大小,heapUsed已经增加到约12MB
> process.memoryUsage();
{ rss: 30232576,
heapTotal: 17694720,
heapUsed: 13068464,
external: 8688 }
// 手动清除变量key对数组的引用
// 注意这里并没有清除WeakMap中键名对数组的引用
> key = null;
null
// 再次执行垃圾回收
> global.gc()
undefined
// 查看内存占用大小,发现heapUsed已经回到了之前的大小(这里约为4.8M,原来为4.4M,稍微有些浮动)
> process.memoryUsage();
{ rss: 22110208,
heapTotal: 9158656,
heapUsed: 5089752,
external: 8698 }
虽然我们没有手动清除 WeakMap
中对键名的引用, 但是内存依旧已经回到原始的大小, 说明数组已经被收回, 这就是弱引用的具体含义。