相信很多前端同学都遇到过这样一道经典的面试题:当用户在浏览器输入url地址并按下回车会发生什么
这里其中对前端技术广度的了解,以及对每个技术点深度的掌握,非常考验一名前端工程师的内功。
而这里“浏览器的渲染原理”所说的是这整个过程的一部分。
当浏览器的网络线程收到 HTML 文档后,产生一个渲染任务,并将其传递给渲染主线程的消息队列,
在事件循环机制的作用下,渲染主线程取出消息队列中的渲染任务,开启渲染流程。
整个渲染流程分为多个阶段,分别是:
Parse HTML、Recalculate Style、Layout、Layer、Paint、Tiling、Raster、Draw
(HTML 解析、样式计算、布局、分层、绘制、分块、光栅化、画)
每个阶段都有明确的输入输出,上一个阶段的输出会成为下一个阶段的输入。
这样,整个渲染流程就形成了一套组织严密的生产流水线。
渲染的第一步是解析 HTML。
解析过程中遇到 CSS 解析 CSS,遇到 JS 执行 JS。为了提高解析效率,浏览器在开始解析前,
会启动一个预解析的线程,率先下载 HTML 中的外部 CSS 文件和 外部的 JS 文件。
如果主线程解析到link位置,此时外部的 CSS 文件还没有下载解析好,主线程不会等待,继续解析后续的 HTML。
这是因为下载和解析 CSS 的工作是在预解析线程中进行的。这就是 CSS 不会阻塞 HTML 解析的根本原因。
如果主线程解析到script位置,会停止解析 HTML,转而等待 JS 文件下载好,并将全局代码解析执行完成后,才能继续解析 HTML。
这是因为 JS 代码的执行过程可能会修改当前的 DOM 树,所以 DOM 树的生成必须暂停。
这就是 JS 会阻塞 HTML 解析的根本原因。(这里我们先不考虑defer和async的情况,需要另行解释)
第一步完成后,会得到 DOM 树和 CSSOM 树,浏览器的默认样式、内部样式、外部样式、行内样式均会包含在 CSSOM 树中。
(关于预解析线程的优化策略,各个浏览器的实现方式不尽相同,这个点笔者会后续整理出一个专门说清它的文章)
Parse HTML过程,一图胜千言。
渲染的下一步是样式计算。
主线程会遍历得到的 DOM 树和CSSOM,依次为树中的每个节点计算出它最终的样式,称之为 Computed Style。
在这一过程中,很多预设值会变成绝对值,比如red会变成rgb(255,0,0);相对单位会变成绝对单位,比如em会变成px
这一步完成后,会得到一棵带有样式的 DOM 树。
接下来是布局,布局完成后会得到布局树。
布局阶段会依次遍历 DOM 树的每一个节点,计算每个节点的几何信息。例如节点的宽高、相对包含块的位置。
大部分时候,DOM 树和布局树并非一一对应。
比如display:none的节点没有几何信息,因此不会生成到布局树;
又比如使用了伪元素选择器,虽然 DOM 树中不存在这些伪元素节点,但它们拥有几何信息,所以会生成到布局树中。
还有匿名行盒、匿名块盒等等都会导致 DOM 树和布局树无法一一对应。
这里一步我们理解为,拥有几何信息的部分,需要展示在页面的部分的一棵树,不展示的自然也就不会存在在布局树上。
这是布局树和带有样式的dom树的区别。
我们来小结一下:
这个世界上的浏览器无时无刻不在进行着渲染任务,它们勤勤恳恳进行着这个流水线,一刻也没有停歇。目前我们才进行到流水线的第三步
Parse HTML、Recalculate Style、Layout
解析html为dom和cssom,遍历dom和cssom进行样式计算成一颗带有样式的dom树,根据dom树的几何信息生成布局树,布局树和dom树并不是一一对应的。
下一步是分层
主线程会使用一套复杂的策略对整个布局树中进行分层。
分层的好处在于,将来某一个层改变后,仅会对该层进行后续处理,从而提升效率。
滚动条、堆叠上下文、transform、opacity 等样式都会或多或少的影响分层结果,也可以通过will-change属性更大程度的影响分层结果。
这其实是浏览器的一个优化策略,我们知道后续我们对页面dom操作,
浏览器又要重新进行一次渲染流水线,但是有些部分我们并没有变动,是不是可以优化一下只改动变化的部分呢,
于是浏览器进行了分层,改动后,只对该层进行处理。
如果你熟悉 PS,相信你会很容易理解图层的概念,正是这些图层叠加在一起构成了最终的页面图像
那么,浏览器会如何分层呢,这又是一个单独的篇章,这里笔者后续也会整理一篇浏览器分层策略的文章。
再下一步是绘制
主线程会为每个层单独产生绘制指令集,用于描述这一层的内容该如何画出来。
这一步其实是流程中主线程需要向合成线程发出指令了,生成一个一个的指令集合,这个步骤被称之为绘制。
完成绘制后,主线程将每个图层的绘制信息提交给合成线程,剩余工作将由合成线程完成。
我们来小结一下:
得到布局树之后,浏览器进行了更底层的操作,Layer、Paint(分层、绘制),
这里会ps的同学可能很好理解分层的概念,类似于ps的图层,为后续改动页面做优化准备,绘制这一步我们基本就做不了什么操作了。
接下来渲染主线程终于可以休息一下了,它会把绘制出的指令集交由给合成线程去完成后续操作。
合成线程首先对每个图层进行分块,将其划分为更多的小区域。
它会从线程池中拿取多个线程来完成分块工作。
分块完成后,进入光栅化阶段。
合成线程会将块信息交给 GPU 进程,以极高的速度完成光栅化。
GPU 进程会开启多个线程来完成光栅化,并且优先处理靠近视口区域的块。
光栅化的结果,就是一块一块的位图
最后一个阶段就是画了
合成线程拿到每个层、每个块的位图后,生成一个个「指引(quad)」信息。
指引会标识出每个位图应该画到屏幕的哪个位置,以及会考虑到旋转、缩放等变形。
变形发生在合成线程,与渲染主线程无关,这就是transform效率高的本质原因。
合成线程会把 quad 提交给 GPU 进程,由 GPU 进程产生系统调用,提交给 GPU 硬件,完成最终的屏幕成像。
所以了解了整个渲染过程,那么我们看看面试题还会问的东西是否就是降纬打击了?
什么是 reflow?
reflow 的本质就是重新计算 layout 树,我们翻译为重排。
当进行了会影响布局树的操作后,需要重新计算布局树,会引发 layout以及后续全部流程
为了避免连续的多次操作导致布局树反复计算,浏览器会合并这些操作,当 JS 代码全部完成后再进行统一计算。所以,改动属性造成的 reflow 是异步完成的。
但是有一个关键点需要注意:当js去获取某个dom属性时,由于前面是合并异步操作,所以这样可能会获取不到最新的dom布局信息,
所以浏览器决定当我们代码中js调用获取布局属性的api时,会立即同步执行reflow,
这点我们可以做为优化点,尽量少地去使用获取dom属性的api,而自己去计算,让浏览器异步去合并再reflow
什么是 repaint?
repaint 的本质就是重新根据分层信息计算了绘制指令。我们翻译为重绘。
当改动了可见样式后,就需要重新计算,会引发 repaint。
而浏览器判断为重绘操作只需要进行样式计算就可以进入到Paint流程,如下图
由于元素的布局信息也属于可见样式,所以 reflow 一定会引起 repaint。
为什么 transform 的效率高?
因为 transform 既不会影响布局也不会影响绘制指令,它影响的只是渲染流程的最后一个「draw」阶段
由于 draw 阶段在合成线程中,所以 transform 的变化几乎不会影响渲染主线程。反之,渲染主线程无论如何忙碌,也不会影响 transform 的变化。
transform的变化,浏览器只会通知合成线程重新draw一下即可,所以他的变化对于浏览器来说非常高效。
自此我们已经完全地走过了浏览器的渲染流程,我们又完成了一次对前端技术深度的探索,大家一起加油。