Javascript 是自动进行内存管理的,而且对于开发人员是不可见的。我们创建的基本类型,对象,函数……都需要消耗内存
当一些内存不再需要时会发生什么? JavaScript 引擎如何发现它并把它清理掉?
可达性(Reachability)
简而言之,“可达”值是那些以某种方式可以访问或者可用的值。他们被存储在内存中
1. 这里列出了一些固定的可达值,这些值是不能释放的,例如:
- 当前函数的局部变量和参数
- 当前嵌套的,调用链上的其他函数的变量和参数
- 全局变量
- (还有一些其他的内部的变量)
这些值被称为 根(roots)
2. 如果一个值可以通过引用或者引用链从根访问任何其他的值,则认为该值是可达的
比如,局部变量中有一个对象,并且该对象有一个属性 A 引用了另一个对象 B, 则对象 A 被认为是可达的,而且它的引用也是可达的
在 JavaScript 引擎中有一个被称作 垃圾回收器 的东西在后台执行。它监控着所有对象的状态,并删除掉那些不可达的
一个简单的例子
// user 具有对这个对象的引用
let user = {
name: "John"
};
这里的箭头描述了一个引用关系。全局变量
user
引用了对象 { name: "John"}
(为了简洁起见,我们将其命名为 John)。John 的 name
属性存储了一个原始值,所以它可以被写在对象内部
如果 user
的值被重写,这个引用就失效了
user = null;
现在 John 变成不可达的了,因为没有引用,就不能访问到 John。垃圾回收器会回收 John 并且释放内存
两个引用
现在我们把 user
复制给 admin
// user has a reference to the object
let user = {
name: "John";
};
let admin = user;
把
user
对 John 的引用切断
user = null;
John 仍然可以通过 admin
被访问到,因此 John 仍在内存中。如果我们切断 Aadmin
和 John 之间的引用,那么这时候,John 将被回收
相互关联的对象
现在我们来看一个更复杂的例子:
function marry(man, woman) {
woman.husband = man;
man.wife = woman;
return {
father: man,
mother: woman,
}
}
let family = ({
name: "John",
}, {
name: "Ann"
});
marry
这个函数让两个对象“结婚”了,并且返回一个包含两个对象的新对象
内存结构:
现在,所有的对象都是可以访问的
我们删除两个引用
delete family.father;
delete family.mother.hunband
如果只是删除这两个引用中的一个,那么所有的对象仍然是 可达 的
现在删除了两个引用,我们可以看到 John 不再有传入的引用,也就不再 可达
输出的引用是无关紧要的,只有传入引用才能使对象可访问。现在 John 将被回收
垃圾回收之后
无法访问的数据块
也有可能没有指向整个对象的引用,然后将整个对象从内存中删除
family = null;
现在的情况:
这个例子演示了 可达性 的重要性
显而易见 John 和 Ann 仍然是相互链接的,它们都有指向他们的引用,但这还不够
family
对象已经从根上断开了链接,不再有对它的引用,因此整个块变得 不可达,所以它将被删除
内部算法
基本的回收算法称作 标记-删除
下面是定期执行“垃圾回收”的算法
- 垃圾回收器找到所有的根,并且标记(记住)它们
- 然后遍历并”标记“所有来自根的引用
- 然后遍历并”标记“ 来自根的引用的引用。所有被访问的对象都被记住,以便以后不再访问同一个对象两次
- 以此类推,直到所有 可达 的引用(从根部开始)都被访问到
- 没有标记的对象都会被删除
举个例子:
我们的对象有如下结构:
我们可以清楚的看到右侧有一块无法访问的内存。现在我们来看看 标记-清除 机制是如何进行的
第一步,标记所有来自根部的引用
继续标记
......继续标记
现在,无法通过这个过程访问到的对象被认为是 不可达的,并且会被删除
我们可以将这个过程想象成油漆从油漆桶(根)溢出,油漆流经所有引用并标记所有 可到达 的对象。然后移除未标记的。
这就是垃圾回收的工作原理。另外 JavaScript 做了很多优化以使它运行的更快并且不影响代码的执行
一些优化
- 分代回收(Generational collection):对象分为两组 “新对象” 和 “旧对象”。许多对象都回经历这一个过程 出现-工作-回收,有一些对象“活”的很久,就会变“老”,被检查的次数也随之变少
- 增量回收(Incremental collection):如果有很多对象,并且我们试图一次遍历并标记整个对象集,那么可能会花费一些时间,并在执行中会有一定的延迟。因此,引擎试图将垃圾回收分解为多个部分。然后,各个部分分别执行。这需要额外的标记来跟踪变化,这样有很多微小的延迟,而不是很大的延迟
- 空闲时间收集(Idle-time collection):垃圾回收器只在 CPU 空闲时运行,以减少对执行的影响
总结
- 垃圾回收是自动进行的,我们不能强制执行或是阻止
- 当对象是 可达 状态时,它一定是存在于内存中的
- 被引用与 可达(从一个根出发)不同:一组相互连接的对象可能整体都不可达
这是我翻译的
原文: Garbage collection
不可达的就是垃圾
通过 标记-清除 的方法捡垃圾
这是一个找垃圾,和捡垃圾的过程