第一章 浏览器和浏览器内核
- 渲染引擎的组成:HTML解释器、CSS解释器、布局(Layout)、JS引擎、绘图等
- Blink和Webkit的不同:
- 跨进程的iframe:为了解决iframe潜在的安全问题,为iframe创建一个单独的沙箱进程
- 将DOM引入JS引擎中,提升js访问DOM的性能
- 接口的修改、性能优化等
- 浏览器和对应的渲染引擎:
Trident | Gecko | Webkit
:------------: | :-------------:
IE | Firefox | Safari Chrome Android浏览器 ChromeOS等
第二章 HTML网页和结构
- Webkit渲染过程:
- 通过资源加载器加载URL对应的网页
- 网页被交给HTML解释器转变成Token
- HTML解释器依据Token构建节点,形成DOM树
- 如果节点是js代码,调用js引擎解释执行
- 如果节点是图片、css、视频等资源,会调用资源加载器来加载它们,因为它们是异步的,不会阻碍当前DOM树的继续创建;如果是js资源,则需要停止当前DOM树的创建,直到js资源加载并被执行后才会继续DOM的创建。
- 由于有些资源是异步的,所以
DOMContentLoaded
和onLoad
事件一般不是同步的,前者要完成的早一些。 - DOM构建过程中会执行js代码,因此需要注意js的位置,防止在DOM还没构建的情况下被js代码访问。
第三章 Webkit架构和模块
- 浏览器是多进程的,包括:Browser进程、每个网页的Render进程、插件进程、GPU进程等进程:
- Browser进程和页面渲染是分开的,这保证了页面渲染的崩溃不会导致浏览器主界面的崩溃。
- 每个网页是独立的进程,保证了页面之间相互不影响。
- 插件进程的问题不会影响浏览器主界面和网页。
- GPU加速也是独立的。
- 浏览器中的进程基本上是多线程的,如Browser进程包括UI线程和I/O线程等,网页的Render进程包括渲染线程和I/O线程等,GPU进程包括I/O线程和GL线程等:
- Browser进程收到用户的请求,首先交由UI线程处理,而且将相应的任务交给I/O线程,它随即将该任务传递给Render进程。
- Render进程的I/O线程经过简单的解释后交给渲染线程,渲染线程接受请求,加载网页并渲染网页,这其中需要Browser进程获取资源和需要GPU进程来帮助渲染。最后Render进程将结构有I/O线程传递给Browser进程。
- Browser进程接收到结果并将结果绘制出来。
第四章 资源加载和网络栈
资源加载是一个很耗时的过程。异步执行资源(如图片、css等)的加载和执行是不会影响当前Webkit的渲染过程。同步执行的js文件会阻塞主线程的渲染过程,这会严重影响Webkit下载资源的效率;因为后面还有需要要下载的资源。这种情况下Webkit会启动另外一个线程去遍历后面的HTML网页,收集需要的资源URL,然后发送请求,这样可以避免被阻塞。与此同时,Webkit能够并发下载这些资源,甚至并发下载js代码,这种机制对于网页的加载提速是很明显的。
渲染引擎、js引擎、js加载三者是互斥的?至少前两者是的。
由于安全(Render进程是没有权限去获取资源的)和效率上的考虑,Render进程的资源获取实际上是通过进程间通信将任务交给Browser进程来完成,Browser进程有权限从网络和本地获取资源。
Chroumium的本地缓存包括一个索引文件和四个数据文件(如果缓存比较大,那么是一个数据文件)。
SDPY协议是HTTP2的基础,它的核心思想是多路复用,仅使用一个连接链传输一个网页中的众多资源:
- 利用一个TCP连接传输不限个数的资源请求,减少了TCP连接的维护成本。HTTP1.1版本里,一个TCP请求里所有的数据是按照顺序进行的,服务器处理完上一个请求才会处理下一个请求,这样如果前面的请求慢,容易造成后面请求的排队,这也就是所谓队头阻塞。SDPY里可同时发送多个请求,而且不用按照顺序一一对应,避免了请求的阻塞。
- 根据资源请求的特性和优先级,调整这些资源请求的优先级。
- 允许服务器未经请求,主动向客户端发送资源,这叫做服务器推送。
- 引入新的压缩技术(一方面使用gzip或compress压缩后再发送;另一方面,客户端和服务器同时维护一张头信息表,所有字段都会存入这个表,生成一个索引号,以后就不发送同样字段了,只发送索引号)
第五章 HTML解释器和DOM模型
HTML解释器的流程:
字节流(bytes)->字符流(characters)->词语(token)->Xss验证(可选)->节点->DOM树
。 DOM树的创建只能在渲染线程上创建和访问,从字符串到词语这个阶段可以交给单独的线程来做。当渲染引擎接收到一个事件的时候,它会通过HitTest(Webkit中一种检查触发事件在哪个区域的算法)检查哪个元素是直接的事件目标。
影子(Shadow)DOM:如<vedio>标签,其内部功能是很复杂的,但是对外只暴漏一个html标签;相当于对节点内部封装,外部看到的有限,但是内部逻辑是很复杂的。它主要解决了一个文档中可能需要大量交互的多个DOM树建立和维护各自功能边界的问题。
createShadowRoot
是js中提供的创建影子DOM的方法。
第六章 CSS解释器和样式布局
CSS的样式规则、选择器(标签、类型、ID、属性、后代、子女、相邻同胞)、盒模型、包含块(Containing Block)模型、样式属性(背景、文本、字体、列表、表格、定位)。
CSSOM:CSS对象模型。它的思想是在DOM中的一些节点接口中加入获取和操作CSS属性或者接口的js接口
布局计算是一个递归的过程,这是因为一个节点的大小通常需要计算它的子女节点的位置、大小等信息。当首次加载、viewport大小改变、动画以及通过js改变样式信息时都会触发重新计算布局。
第七章 渲染基础
Webkit的布局计算使用
RenderObject
树并保存计算结果到RenderObject
树中,RenderObject
树同其他树(如:RenderLayer
树)构成Webkit渲染的主要基础设施。为一个DOM树节点创建RenderObject对象的规则:
- DOM书中的document节点
- DOM树中的可视节点,如html、body、div等。Webkit不会为非可视化节点(如meta标签)创建RenderObject对象
- 某些情况下Webkit需要建立匿名RenderObject节点,该节点不对应于DOM树种的任何节点,而是为了Webkit处理的需要
- RenderObject树节点和DOM树节点不是一一对应的关系
- 为RenderObject节点创建新的RenderLayer节点的规则是:(不同于css3硬件加速中的复合图层)
- document节点
- document的子女节点,也就是html节点对应的RenderBlock节点
- 显式的指定CSS位置的RenderObject节点
- 有透明效果的RenderObject节点
- 节点有溢出(overflow)、alpha或者反射等效果的RenderObject节点
- 使用Canvas 2D或 3D(webGL)技术的RenderObject节点
- Vedio节点对应的RenderObject节点
- Webkit的渲染方式主要包括三种:
- 软件渲染:绘图操作由CPU来完成
- 硬件加速渲染:绘图操作由GPU来完成
- 混合模式: 多个层的渲染结果合并到一个图像中,称之为合成渲染
硬件渲染比较适合于3D绘图。2D绘图时GPU不一定比使用CPU有优势,主要因为:1.CPU的缓存机制有效的减少了重复绘制;2.GPU资源相对CPU的内存来说比较紧张; 3. 软件渲染对待更新区域的处理可能优化到只需计算一个极小的区域,而硬件渲染可能需要重新绘制一层或则多层。
- 软件渲染结果基本上存储在CPU内存的一块区域,多数情况下是一个位图(Bitmap);存储结果会被copy到Browser的存储空间,然后通过Browser进程渲染出来。
第八章 硬件加速机制
GPU主要用来绘制3D图形,而且性能很好。GPU不能像软件渲染那样只计算其中更新的区域,需重绘所有区域;因此为了提高GPU的性能,需要对网页进行分层。分层后,部分区域的更新只在网页的一层或者几层,而不需将整个网页重绘;绘制完成后把层合成起来,即利用了GPU能力,又能减少不必要的重绘开销。
硬件加速机制在RenderLayer树建立后需要做三件事情来完成网页渲染:
- Webkit决定将哪些RenderLayer对象组合在一起,形成一个有后端存储的新层,这一新层不久后用户之后的合成(Compositing),这里称之为合成层(Compositing Layer)
- 将每个合成层包含的这些RenderLayer内容绘制在合成层的后端存储中
- 合成器将这些合成层合成起来,形成网页的最终可视化结果
- RenderLayer对象具有以下特征之一,那么它就是合成层(参考css3硬件加速中的复合图层):
- RenderLayer 具有CSS 3D属性或者 CSS 透视效果
- RenderLayer 包含的 RenderObject 节点表示的是使用硬件加速的视频解码技术的vedio元素
- RenderLayer 包含的 RenderObject 节点表示的是使用硬件加速的Canvas 2D元素或者 WebGL 技术
- RenderLayer 使用了CSS透明效果的动画或者CSS变换的动画
- RenderLayer 使用了硬件加速的 CSS FIlter 技术
- RenderLayer 使用了剪裁(clip) 或者反射(Reflection) 属性,并且它的后代中包含一个合成层
- RenderLayer 有一个Z坐标比自己小的兄弟节点,且该节点是一个合成层
硬件加速最终会调用OpenGL/OpenGLES库。GPU进程最终绘制的结果不再像软件渲染那样通过共享内存传递给Browser进程,而是直接将页面的内容绘制在浏览器的标签窗口内。
页面加载后进行绘制时,会经历计算布局、绘图和合成三个阶段,前两者耗时较多。鉴于此提升浏览器渲染性能的两者方法:
- 使用合适的网页分层技术以减少需要重新计算的布局和绘图
- 使用CSS 3D 变形和动画技术:浏览器不需要重新布局,也不需要重新绘图,只需使用合成功能,而合成功能耗时非常少。
第九章 JavaScript引擎
解释性语言(如 js)和编译型语言(如 java c++)的区别:编译确定位置、偏移信息共享以及偏移信息查找。 三者概括起来讲是因为编译型语言可以在编译的时候确定指针位置,而解释性语言只有在执行的时候才会确定。如果找js的属性只能通过属性名匹配去查找,而c++中可以根据偏移位置去直接找到。
一个js引擎要包括一下几部分:
- 编译器:将源代码编译成抽象语法树,某些引擎中还包括将抽象语法树转成字节码
- 解释器:某些引擎中,解释器主要接受字节码,解释执行这个字节码,同时也依赖垃圾回收机制
- JIT工具:(Just-In-Time技术) 它的主要思想是当解释器将源代码解释成内部表示的时候(java字节码就是一个典型的例子),js的执行环境不仅是解释这些内部表示,而且将其中的一些字节码(主要是使用效率高的部分)转成本地代码(汇编代码),这样可以被CPU直接执行,而不是解释执行,从而极大地提高性能。
- 垃圾回收器和分析工具:它们负责垃圾回收和手机引擎中的信息,帮助改善引擎的性能和功效
引擎的流程:
源代码 -> 抽象语法树 -> 字节码 -> 解释器 -> JIT -> 本地代码v8引擎的工作原理
- 数据表示: 数据和句柄,句柄指向数据存储地址。当进行垃圾回收的时候,不需要移动数据(开销大),只需修改句柄中的指针。
- V8不会把抽象语法树转成字节码或者其他中间表示,而是通过JIT直接生成本地代码。 优点:减少了抽象语法树到字节码的转换时间。 缺点:减少了中间表示(字节码)可能的优化机会、有些场景没必要生成本地代码(过度优化)
- 优化回滚:编译器认为某些代码比较稳定,变量类型不会发生改变,然后生成高效的本地代码;如果引擎发现变量类型发生变化,需要使用一种机制将它做的这些错误决定回滚到之前的一般情况,这个过程就是优化回滚。优化回滚是一个很费时的操作,所以能够不回滚,肯定不要回滚。
var count = 0; function ABC(){ count++; if(count < 1000000){ return 123; } return new Date(); }
- 隐藏类和内嵌缓存:V8使用类和偏移位置思想,将本来需要通过字符串匹配来查找属性值的算法改进为使用类似C++编译器的偏移位置机制来实现,这就是隐藏类
上述例子中的a、b两个对象包含相同的属性名,因此它们被归为同一个组,也就是隐藏类,这些属性在隐藏类中有相同的偏移值。当访问这些对象的属性时,可以通过偏移值知道它们的位置并进行访问。function ABC(x, y){ this.x = x; this.y = y; } var a = new ABC(1,1); var b = new ABC(1,2);
内嵌缓存的基本思想是将使用之前查找的结果缓存起来,也就是说V8可以将之前查找的隐藏类和偏移值保存下来。当下次查找的时候,首先比较当前对象是否也是之前的隐藏类,如果是的话,可以直接使用之前的偏移值,从而减少查找表的时间。 - 内存管理:V8采用的分代垃圾回收机制,分为年轻分代、年老分代等。
- 快照机制:快照机制就是将这些内置的对象和函数(如 Math、String、Array)加载之后的内存保存并被序列化。序列化之后的结果很容易被反序列化,经过快照机制的启动时间,可以缩减几毫秒。
JavaScriptCore和V8不同,它会生成平台无关的字节码(和java类似),然后基于此做优化,同时它的句柄不论在32位还是64位平台上,都使用64位来表示。
编写高效的JavaScript代码:
- 类型:把相同类型的元素放到一个数组中,这样引擎可以通过偏移位置来访问它们
- 数据表示:简单类型的数据直接保存在句柄中,这可以有效地减少寻址时间和内存的使用。对于数值来说,能使用整数的尽量不要使用浮点数。
- 内存:及时触发垃圾回收,可以把不再使用的对象的变量设置为空:
a.x=null
,或者通过delete关键字进行删除:delete a.x
;但是后者有可能会由于使用了隐藏类,需要创建新的隐藏类,进而带来一些复杂的额外操作。 - 优化回滚:不要写触发优化回滚的代码
- 新机制: 如通过requestAnimationFrame替代setInterval实现动画等。