- 垃圾收集方式
- 标记清除
- 引用计数
- 性能问题
- 内存管理
JS具有自动垃圾收集机制,也就是说,执行环境会负责管理代码执行过程中使用的内存。在C和C++之类的语言中,开发者的 一项基本任务就是手工跟踪内存的使用情况,这是造成许多问题的根源。
编写JS程序时,开发者不用关心内存使用情况,所需内存的分配以及无用内存的回收完全实现了自动管理。这种垃圾收集机制的原理其实很简单:找出那些不再继续使用的变量,然后释放其占用的内存。为此,垃圾收集器会按照固定的时间间隔,或代码执行中预定义的收集时间,周期性地执行这个操作。
函数局部变量的生命周期
局部变量只在函数执行的过程中存在,而在这个过程中会为局部变量栈(或堆)内存上分配相应的空间,以便存储变量的值。然后在函数中使用这些变量,直至函数执行结束。此时,局部变量就没有存在的必要了,因此可以释放他们的内存以供将来使用。在这种情况下,很容易判断变量是否还有存在的必要。但并非所有情况下都容易就能得出结论。垃圾收集器必须跟踪哪个变量有用哪个变量无用,对于不再有用的变量打上标记,以备将来收回其占用的内存。用于标识无用变量的策略可能会因实现而不同,具体到浏览器中的实现,通常有两个策略。
标记清除
JS中最常用的垃圾收集方式是标记清除(mark-and-sweep),当变量进入环境(例如,在函数中声明一个变量)时,就将这个变量标记为“进入环境”。从逻辑上讲,永远不能释放进入环境的变量所占用的内存,因为只要执行流计入相应的环境,就可能会用到它们。而当变量离开环境时,则将其标记为“离开环境”。
可以使用任何方式来标记变量。比如,可以通过翻转某个特殊的位来记录一个变量何时进入环境,或使用给一个“进入环境的”变量列表及一个“离开环境的”变量列表来跟踪哪个变量发生了变化。说到底,如何标记变量其实并不重要,关键在于采取什么策略。
垃圾收集器在运行时会给存储在内存中所有变量都加上标记。然后,它会去掉环境中的变量以及被环境中的变量引用的变量的标记。在此之后,在被加上标记的变量将被视为准备删除的变量,原因是环境中的变量已经无法访问这些变量了。最后垃圾回收期完成内存清除工作,销毁那些带标记的值并回收他们占用的内存空间。
截止2008年,IE、Firefox、Opera、Chrome、Safari的JS实现使用的都是标记清除式的垃圾收集策略,只不过来及收集的时间间隔有所不同。
引用计数
另外一种不太常见的垃圾收集策略叫做引用计数(reference counting),引用计数的含义是跟踪记录每个值被引用的次数。当声明了一个变量并将一个引用类型值赋给该变量时,则这个值的引用次数就是1.如果同一个值又被赋给另一个变量,则该值的引用次数加1。相反,如果包含对这个值引用的变量又取得了另一个值,则这个值的引用次数减少1。当这个值的引用次数变成0时,则说明没有办法再访问这个值了,因而就可以将其占用的内存空间回收回来。这样,当垃圾收集器下次再运行时,它就会释放那些引用次数为0的值所占用的内存。
Netscape Navigator 3.0 是最早使用计数策略的浏览器,但很快就遇到了一个严重的问题:循环引用。循环引用指的是对象A中包含一个指向对象B的指针,而对象B中也包含一个指向对象A的引用。
function problem(){
var objA = new Object();
var objB = new Object();
// objA和objB通过各自属性相互引用,也就是说,这两个对象的引用次数都是2.
objA.someOtherObject = objB;
objB.anotherObject = objA;
// 在采用标记清除策略的实现中,由于函数执行之后,这两个对象都离开了作用域,因此这种相互引用不是问题。
// 在采取引用计数策略的实现中,当函数执行完毕后,对象继续存在,因为它们的引用次数永远不会是0.
// 计入这个函数被重复多次调用,就会导致大量内存得不到回收。
}
为此,Netscape在Navigator4.0中放弃了引用计数方式,转而采用标记清除来实现其垃圾收集机制。可是引用计数导致的麻烦并未就此终结。
在IE中,有部分对象并不是原生JS对象。例如BOM和DOM中的对象是使用C++以COM(Computer Object Model,组件对象模型)对象的形式实现的,而COM对象的垃圾收集机制采用是计数策略。因此,即时IE的JS引擎是使用标记清除策略来实现,但JS访问的COM对象依然是基于引用计数策略的。换句话说,只要在IE中设计COM对象,就会存在循环引用的问题。
// 在一个DOM元素与一个原生JS对象之间创建了循环引用。
var el = document.getElementById('element');
var obj = new Object();
// 变量obj有一个名为el的属性指向el对象
obj.el = el;
// 变量el也有一个叫做someObject的属性回指obj。
el.someObject = obj;
// 由于存在循环引用,即时DOM从页面中移除,垃圾内存也永远不会被回收。
为了避免类似这种循环引用问题,最好是在不使用它们的时候手工断开原生JS对象与DOM元素之间的连接。
obj.el = null;
el.someObject = null;
将变量设置为null
意味着切断变量与它之前引用的值之间的链接,当垃圾收集器下次运行时,就会删除这些值并回收它们占用的内存。
为解决这个问题,IE9把BOM和DOM对象都转换成真正的JS对象,这样就避免了两种垃圾收集卷发并导致的问题,也消除了常见的内存泄漏现象。
性能问题
垃圾收集器是周期性运行的,如果为变量分配的内存数量很可观,那么回收工作量也是相当大的。在这种情况下,确定垃圾收集的时间间隔是一个非常重要的问题。说到垃圾收集器多长时间运行一次,不禁让人联想到IE因此而声名狼藉的性能问题。
IE的垃圾收集器是根据内存分配量运行的,具体来说就是256个变量、4096个对象(或数组)字面量、数组元素(slot)、64KB的字符串。一旦达到临界值,垃圾收集器就会运行。这种实现方式的问题在于,若一个脚本中保存那么多变量,那么该脚本很可能会在其生命周期中一直保有这么多的变量。而这样一来,垃圾收集器就不得不频繁地运行。结果,由此引发的严重性能问题促使IE7重写了其垃圾收集例程。
随着IE7的发布,其JS引擎的垃圾收集例程改变了工作方式:触发垃圾收集的变量分配、字面量、数组元素的临界值被调整为动态修正。IE7中的各项目临界值在初始化与IE6相等。如果垃圾收集例程回收的内存分配量低于15%,则变量、字面量、数组元素的临界值就会放大。如果例程回收了85%的内存分配量,则将各种临界值重置会默认值。
内存管理
使用具备垃圾收集机制的语言编写程序,开发者一般不必操心内存管理问题。但是JS在进行内存管理及垃圾收集时面临的问题还是有点儿与众不同。其中最主要的一个问题是分配给web浏览器的可用内存数量通常要比分配给桌面应用程序少。这样的目的主要是处于安全性考虑,目的是防止运行JS的网页耗尽全部系统内存而导致系统崩溃。内存限制问题不会影响给代码分配内存,同时还会影响调用栈以及在一个线程中能够同时执行的语句数量。
因此,确保占用最少的内存可让页面获得更好的性能。而优化占用的最佳方式,就是执行中的代码只保存必要的数据。一旦数据不再有用,最好通过将其值设置为null
来释放掉引用 -- 解除引用(dereferencing)。这种做法适用于大多数全局变量和全局对象的属性。局部变量会在它们离开执行环境时自动被解除引用。
// 由于localPerson在createPerson()函数执行完毕后就离开了其执行环境,因此无需显示地去为它解除引用。
function createPerson(name){
var localPerson = new Object();// 创建对象并将其赋给局部变量
localPerson.name = name;// 为对象添加名为name的属性
return localPerson;// 对象以函数值的形式返回
}
// 变量globalPerson获取了createPerson()函数的返回值
var globalPerson = createPerson('Nicholas');
// 手工解除globalPerson的引用
globalPerson = null;
解除一个值的引用并不意味着自动回收该值所占用的内存,解除引用的真正作用是让值脱离执行环境,以便垃圾收集器下次运行时将其回收。