原文 How JavaScript works: inside the V8 engine + 5 tips on how to write optimized code
几周前我们开始了一个系列博文旨在深入挖掘 JavaScript
并弄清楚它的工作原理:我们认为通过了解 JavaScript
的构建单元并熟悉它们是怎样结合起来的,有助于写出更好的代码和应用。
这个系列的第一篇文章聚焦于提供一个关于引擎、运行时和调用栈的概述。本文将会深入分析 Google
的 V8
引擎的内部实现。我们也会提供一些编写更优质 JavaScript
代码的小技巧——我们的团队在构建 SessionStack
应用时遵循的最佳实践。
概述
JavaScript
引擎是执行 JavaScript
代码的程序或解释器。 JavaScript
引擎可以实现为标准的解释器,或即时编译器,以某种形式将 JavaScript
编译成字节码。
以下是一些流行的 JavaScript
引擎项目:
-
V8 —— 开源,
Google
开发,C++
编写 -
Rhino ——
Mozilla
基金会管理,开源,完全使用Java
开发 -
SpiderMonkey —— 第一个
JavaScript
引擎,以前由Netscape Navigator
维护,现在由Firefox
维护 -
JavaScriptCore —— 开源,以
Nitro
的名义销售,由Apple
公司为Safari
浏览器开发 -
KJS ——
KDE
的引擎,最初由Harri Porten
为KDE
项目的Konqueror
浏览器开发 -
Chakra (JScript9) ——
IE
浏览器 -
Chakra (JavaScript) ——
Edge
浏览器 -
Nashorn ——
OpenJDK
开源项目的一部分,由Oracle Java
和其工具集开发 - JerryScript —— 一个轻量级的物联网引擎
为什么要创建V8引擎?
谷歌公司研发的 V8
引擎是由 C++
编写的开源引擎。该引擎使用在谷歌浏览器内部。但与其他引擎不同的是,V8
也应用于 Node.js
这一流行的运行时当中。
V8
最初是为了提高浏览器中 JavaScript
执行的性能而设计的。为了获得速度,V8
将 JavaScript
代码转换成更高效的机器编码而不是使用解释器。同其他现代 JavaScript
引擎如 SpiderMonkey
或 Rhino
(Mozilla
)所做的一样,V8
通过实现即时编译器在执行时将 JavaScript
代码编译成机器代码。其中最主要的区别是 V8
不生成字节码或任何中间代码。
V8曾有两个编译器
在 V8
5.9版本发布之前(2017年初发布),该引擎使用两个编译器:
- full-codegen —— 简单、非常快的编译器,生成简单和相对较慢的机器代码
- Crankshaft —— 更加复杂的(即时)优化编译器,生成高度优化的代码
同时 V8
内部使用了多条线程:
- 主线程的工作正如你所预期:获取代码、编译然后执行代码
- 另有一条独立线程负责编译,这样主线程可以在前者优化代码时继续执行
- 一条分析器线程会告诉运行时,哪些方法会耗费大量时间以便
Crankshaft
编译器优化代码 - 还有几条线程处理垃圾回收清理
首次执行 JavaScript
代码时,V8
利用 full-codegen
无过渡地直接将解析后的 JavaScript
转换成机器代码。这使得它可以非常快速地开始执行机器代码。注意 V8
不使用中间代码表示,因此摆脱了对解释器的需要。
在你的代码运行了一定时间后,分析线程就能收集到足够的数据判断哪些方法需要优化。
接着,Crankshaft
优化在另一线程开始。它将 JavaScript
抽象语法树转换成高级静态单赋值(SSA
)表示,称为 Hydrogen
(注:氮),并尝试优化氮图。大多数优化都在这个级别完成。
内联
优化的第一步是先内联尽可能多的代码。内联是一个将调用引用(函数调用的那行代码)替换成所调用的函数体的过程。这个简单的步骤使接下来的优化过程更有意义:
隐藏类
JavaScript
是基于原型的语言:没有类,使用克隆的方式创建对象。JavaScript
还是一个动态编程语言,这意味着当对象被初始化之后还可以轻易地增删其属性。
大多数 JavaScript
解释器采用类字典数据结构(基于哈希函数)来存储对象属性值在内存中的位置。这种结构使得在 JavaScript
中取回属性值的计算开销比非动态语言如 Java
或 C#
更昂贵。在 Java
中,所有的对象属性在编译前就由固定对象布局决定了,不允许在运行时动态增加或删除(C#
有动态类型,但那是另一个话题)。因此,属性值(或指向属性的指针)就可以以连续缓冲区存储在内存中,之间用固定的偏移量隔开。偏移量的长度简单地根据属性的类型确定,然而这在 JavaScript
中是不可能的,因为属性类型可以在运行时更改。
由于通过字典查找对象属性在内存中的位置非常低效,V8
采用了另一方法作为替代:隐藏类。隐藏类的原理类似于 Java
等语言中使用的固定对象布局(类),除了是在运行时创建。现在,让我们来看看它们实际是什么样的:
function Point(x, y) {
this.x = x;
this.y = y;
}
var p1 = new Point(1, 2);
当 new Point(1, 2)
调用发生,V8
将创建了一个名为 C0
的隐藏类。
现在 Point
还没有定义任何属性,所以 C0
是空的。
一旦第一条声明 this.x = x
开始执行(在 Point
函数内),V8
将创建第二个基于 C0
的隐藏类 C1
。C1
描述了在内存中(相对于 point
对象)能找到属性 x
的位置。在这个例子中,x
保存在偏移量为 0
的位置,这意味着在将内存中的对象视作一个连续缓冲区时,第一个偏移量对应着 x
。V8
还会通过一个“类转换”更新 C0
,以表明如果一个属性 x
被添加到 point
对象中,隐藏类 C0
就会转换成 C1
。下面 point
对象的隐藏类现在变成了 C1
。
当 this.y = y
语句执行时将会重复同样的过程(同样在 Point
函数内,this.x = x
之后)。
新的隐藏类 C2
将被创建,C1
发生类转换表示如果向一个 Point
对象添加属性 y
(已经包含一个属性 x
),隐藏类应该更新为 C2
,并且 point
对象的隐藏类更新为 C2
。
隐藏类转换依赖向对象所添加属性的顺序。请看下面的代码片段:
function Point(x, y) {
this.x = x;
this.y = y;
}
var p1 = new Point(1, 2);
p1.a = 5;
p1.b = 6;
var p2 = new Point(3, 4);
p2.b = 7;
p2.a = 8;
现在你可能会假设 p1
和 p2
使用相同的隐藏类和转换。实际则并非如此。对于 p1
,先添加属性 a
然后添加属性 b
。而对于 p2
,先添加的属性是 b
然后才是 a
。因此,由于转换路径不同, p1
和 p2
最终将会产生不同的隐藏类。在这种情况下,最好在初始化动态属性时保持顺序一致以便复用相同的隐藏类。
内联缓存
V8
利用了另一项叫做内联缓存的技术来优化动态类型语言。内联缓存依赖于这样一种观察:同一方法的重复调用通常发生在同一类型的对象上。关于内联缓存的深入阐述在这里。
我们准备介绍内联缓存的一般概念(以免你没有时间查看上述的深入阐述)。
那么它的原理是什么?V8
维护着在最近的方法调用中作为参数传入的对象类型的缓存,并利用这个信息假设未来会被当做参数的对象的类型。如果 V8
能很好地假设出将要传入方法的对象的类型,就能直接越过如何获取对象属性的计算过程,取而代之的是使用之前查找对象的隐藏类时存储的信息。
那么隐藏类是如何与内联缓存关联起来的?每当某一对象调用方法时,V8
必须执行对此对象的隐藏类的查询来确定访问某个属性的偏移量。当对同一隐藏类成功调用过两次同样的方法后,V8
将省略对隐藏类的查询而只将属性偏移量添加到对象指针本身。对于那个方法未来所有的调用,V8
都假定隐藏类不改变,并利用之前查询存储的偏移量直接跳到某一属性的内存地址。这极大地提高了执行速度。
内联缓存也是同类对象共享同一隐藏类如此重要的原因。如果你创建了拥有不同隐藏类的两个同类对象(正如前面的例子),V8
就无法使用内联缓存,因为即便这两个对象是相同的类型,但他们对应的隐藏类为属性指定了不同的偏移量。
编译到机器代码
一旦氮图优化好后,Crankshaft
会将它降为更低水平的表示,称为 Lithium
(注:锂)。大多数 Lithium
的实现依赖于特定架构。寄存器分配发生在这个级别。
最终,Lithium
被编译成机器代码。随后发生 OSR
:堆栈上替换。在开始编译和优化明显长时间运行的方法前,我们可能会运行它。V8
不会在再次开始执行优化版本时忘记那些缓慢的执行。而是转换我们所有的上下文(栈,寄存器)以便能在执行中切换到优化版本。这是个非常复杂的任务,记住在其他的优化中,V8
最先做了代码内联。V8
不是唯一有这种能力的引擎。
还有种被称为反优化的安全措施能做反向转换,回退到未优化代码,以防引擎做出的假设不再成立。
垃圾回收
在垃圾回收方面,V8
采用传统分代方法标记和清扫来清理老的代。标记阶段会暂停 JavaScript
的执行。为了控制垃圾回收的开销并使执行更加稳定,V8
采用增量标记:它不遍历全部栈堆,而是尝试标记每一个可能的对象,它只遍历栈堆的一部分,然后恢复正常执行。下一次垃圾回收暂停会在之前栈堆的停止位置继续。这可使正常执行期间只发生相当短的暂停。正如之前提到的,清理阶段由单独的线程处理。
Ignition 和 TurboFan
随着2017年初 V8
5.9版本的发布,一个新的执行管道被引入。新的管道在实际的JavaScript
应用中实现了更大的性能提升和的显著的内存节省。
新的执行管道构建在 V8
的解释器 Ignition
和 V8
最新的优化编译器 TurboFan
之上。
你可以在这里查阅 V8
团队关于这个主题的博文。
自从 V8
5.9版本发布以来, V8
就不再在 JavaScript
执行里使用 full-codegen
和 Crankshaft
(自2010年来一直支撑着 V8
的技术),这是由于 V8
团队也在努力地跟上新的 JavaScript
语言特性的脚步和这些特性所需的优化。
这意味着将来在整体上 V8
将拥有更加简单和更易于维护的架构。
这些提升仅仅是个开始。新的 Ignition
和 TurboFan
管道铺垫了更远的优化之路,将会推进 JavaScript
的性能并在接下来的几年里缩小 V8
在 Chrome
和 Node.js
中的足迹。
最后,这里有几条关于如何编写更优化的、更好的 JavaScript
代码的建议和技巧。虽然你可以很容易地从上述的内容中得到这些,为了方便还是把它们做了以下的总结:
怎么编写优化的JavaScript
- 对象属性的顺序:始终使用相同的顺序初始化对象属性,以便共享隐藏类和随后的优化代码。
- 动态属性:在初始化完成之后添加对象动态属性会强制改变隐藏类并使之前的隐藏类已优化的方法变慢。相反,在对象的构造器里指定所有的属性。
- 方法:重复执行相同方法的代码会比仅执行一次许多不同的方法运行的更快(由于内联缓存)。
- 数组:避免使用键值不递增的稀疏数组。并非每个元素都存在的稀疏数组是一个哈希表。访问稀疏数组的元素将会花费更昂贵的开销。此外,避免预先分配大数组。最好是按需要增加长度。最后,不要删除数组中的元素。这会使数组变得稀疏。
-
带标记的值:
V8
用32位字节表示对象和数字。其中使用了一个位来标识是对象(标识为1)或是整数(标识为0),由于它们是31位的而被称为SMI
(SMall Integer
)。如果一个数值大小超过了31位可以表示的数字,V8
将会包装它,将其转换为一个双字节类型值并创建一个新的对象存入其中。尽量使用31带符号的数值避免JS
对象的昂贵包装操作。