diff之React:Virtual DOM

一、读懂diff

diff是Unix/Linux系统的一个很重要的工具程序。
它用来比较两个文本文件的差异,是代码版本管理的基石之一。

diff <文件1> <文件2>

diff就会告诉你,这两个文件有何差异。

1. diff的三种格式
  • 正常格式
  • 上下文格式
  • 合并格式
2. 创建示例文件
touch test1
vim test1 //写入12345
cat test1
cp test1 test2
vim test2//修改5位6  12346
cat test2
3. 正常格式
diff test1 test2 
对比

解析:

  • 5c5:用来说明改变的位置。前面的5表示第一个文件第5行改变,a(add),c(change),d(delete)。后面的5表示第二个文件变动行。
  • < 5:前面的小于号,表示要从test1当中删除的内容。
  • ---:test1和test2的分割线。
  • > 6:前面的大于号,表示要从test2当中增加该内容。
4. 上下文格式

上面的结果显示太简单不易理解,所以加入上下文的方式。它的使用方法是加入c参数(代表context)

为了更明显的显示上下文的效果 我们把文件改成如下内容:


test1

test2
diff -c test1 test2
对比结果

解析:

  • ***:表示修改前的文件。
  • ---:表示修改后的文件。
  • 6,13:表示显示的行6-13行。这时不仅显示发生变化的行内容,变化内容前面三行和后面三行。
  • 另外,文件内容的每一行最前面,还有一个标记位。
    如果为空,表示该行无变化;
    如果是感叹号(!),表示该行有改动;
    如果是减号(-),表示该行被删除;
    如果是加号(+),表示该行为新增。
5. 合并格式

如果两个文件相似度很高,那么上下文格式的diff,将显示大量重复的内容,比较浪费空间。
使用方式加一个参数u

diff -u test1 test2
合并结果
6. git格式的diff

版本管理系统git,使用的是合并格式diff的变体。

git diff
结果

解析:

  • 进行比较的是,a版本的test1(即变动前)和b版本的test2(即变动后)。
  • 第二行表示两个版本的git哈希值(index区域的fcb0de4对象,与工作目录区域的1e628d3对象进行比较),最后的六位数字是对象的模式(普通文件,644权限 读写-读-读 =>属主-组成员-其他用户)。
7. diff程序原理

在diff里面,我们比较的两个文件叫做old和new,而一般是按行来比较。这里我们可以抽象成一个字符串的比较,比如:
old: abc
new: abcd
那么其中的每一个字符都可以表示文件里面的一行。那么diff里面用到的比较思想是从old和new里面找出最长的subsequence。这是基于LCS(Longest Common Subsequnece)算法。

子序列的概念是......举例说明吧:

a b c d e f g h i
a b c h d f g ij

那么最长公共子序列就是:abcdfgi(不需要连续)。

 lcs = (A, B) ->
    result = 0
    if A.length is 0 or B.length is 0
        result
    else if A[0] is B[0]
        result = 1 + lcs(A[1..], B[1..])
    else
        result = Math.max(lcs(A, B[1..]), lcs(A[1..], B))
使用递归来计算最长的相似元素的长度。

矩阵的列是old,横坐标是new

MJAU
GC||GA

详情阅读LCS算法

二、首先了解一下虚拟DOM
1. 对前端状态管理的小总结

在最开始我们对于状态改变更新对应的视图,都是操作dom。但是对于复杂的应用程序来说,无疑这是很低效率,不便于维护的。

于是,出现了MVC等架构模式,希望能从代码组织方式来降低维护这种复杂应用程序的难度。但是 MVC 架构没办法减少你所维护的状态,也没有降低状态更新你需要对页面的更新操作(前端来说就是DOM操作),你需要操作的DOM还是需要操作,只是换了个地方。

于是,后来人们想出了 MVVM 模式,只要在模版中声明视图组件是和什么状态进行绑定的,双向绑定引擎就会在状态更新的时候自动更新视图。

MVVM 可以很好的降低我们维护状态 -> 视图的复杂程度。但是这不是唯一的办法,还有一个非常直观的方法,可以大大降低视图更新的操作:一旦状态发生了变化,就用模版引擎重新渲染整个视图,然后用新的视图更换掉旧的视图。最大的问题就是这样做会很慢,因为即使一个小小的状态变更都要重新构造整棵 DOM,性价比太低。Virtual DOM 就是这么做的,只是加了一些特别的步骤来避免了整棵 DOM 树变更。

2. Virtual DOM

DOM很慢,轻微的操作都可能导致页面重新排版,非常耗性能。

相对于DOM对象,js对象处理起来更快,而且更简单。

Virtual DOM算法原理就是:用 JavaScript 对象表示 DOM 信息和结构,当状态变更的时候,重新渲染这个 JavaScript 的对象结构。 我们用新的对象树去比对旧的对象树,记录差异,然后应用到真正的DOM树上面去。这样我们就不需要重新构造整个DOM树了。本质就是:在js和DOM之间做了一个缓存。

3. 对React Virtual DOM 的误解

React 从来没有说过 “React 比原生操作 DOM 快”。React 的基本思维模式是每次有变动就整个重新渲染整个应用。如果没有 Virtual DOM,简单来想就是直接重置 innerHTML。很多人都没有意识到,在一个大型列表所有数据都变了的情况下,重置 innerHTML 其实是一个还算合理的操作... 真正的问题是在 “全部重新渲染” 的思维模式下,即使只有一行数据变了,它也需要重置整个 innerHTML,这时候显然就有大量的浪费。

  • 框架的意义在于为你掩盖底层的 DOM 操作,让你用更声明式的方式来描述你的目的,从而让你的代码更容易维护。

  • 没有任何框架可以比纯手动的优化 DOM 操作更快,因为框架的 DOM 操作层需要应对任何上层 API 可能产生的操作,它的实现必须是普适的。在构建一个实际应用的时候,我们不可能为每一个地方都去做手动优化,出于可维护性的考虑,这显然不可能。

  • 框架给你的保证是,你在不需要手动优化的情况下,我依然可以给你提供过得去的性能。

4. React:虚拟DOM Diff算法基础学习

步骤1:用js对象模拟DOM树

代码

代码运行效果

步骤2:DOM Diff算法
即给定任意两棵树,找到最少的转换步骤。但是标准的的Diff算法复杂度需要O(n^3),这里n表示的是树的节点的总数。这显然无法满足性能要求。要达到每次界面都可以整体刷新界面的目的,势必需要对算法进行优化。这看上去非常有难度,然而Facebook工程师却做到了,他们结合Web界面的特点做出了两个简单的假设,使得Diff算法复杂度直接降低到O(n),这相当于一个一层的for循环。

  • Web 中DOM节点跨层次的移动操作很少,可以忽略不计
  • 拥有相同类的两个组件将会生成相似的树形结构,拥有不同类的两个组件将会生成不同的树形结构。
  • 对于同一层次的一组子节点,它们可以通过唯一的id进行区分。

基于以上三个前提策略,React对diff算法进行了优化。使得算法的复制度降到了O(n)。

tree diff
DOM的diff算法实际上只会对树进行逐层的比较。

比较图
【示例1】

【示例1】React diff 的执行情况:create A -> create B -> create C -> delete A。

当出现节点跨层级移动时,并不会出现想象中的移动操作,而是以 A 为根节点的树被整个重新创建,这是一种影响 React 性能的操作,因此 React 官方建议不要进行 DOM 节点跨层级的操作。所以保持稳定的DOM结构会有助于性能的提升。

component diff

  • 对于同一类型的组件,会按照原策略继续比较 virtual DOM tree。
  • 对于不同类型的组件,直接整个替换,即使结构非常相似。

element diff
当节点处于同一层级时,React diff 提供了三种节点操作,分别为:INSERT_MARKUP(插入)、MOVE_EXISTING(移动)和 REMOVE_NODE(删除)。

ABCD--->BADC 这样我们需要做的就很多了,我们需要删除ABCD 然后插入DCBA。

React 发现这类操作繁琐冗余,因为这些都是相同的节点,但由于位置发生变化,导致需要进行繁杂低效的删除、创建操作,其实只要对这些节点进行位置移动即可。

针对这一现象,React 提出优化策略:允许开发者对同一层级的同组子节点,添加唯一 key 进行区分,虽然只是小小的改动,性能上却发生了翻天覆地的变化!

那么对于上面的例子,我们就可以只移动AC,BD不做任何操作。

移动

那么,如此高效的 diff 到底是如何运作的呢?

首先对新集合的节点进行循环遍历,for (name in nextChildren),通过唯一 key 可以判断新老集合中是否存在相同的节点,if (prevChild === nextChild),如果存在相同节点,则进行移动操作,但在移动前需要将当前节点在老集合中的位置与 lastIndex 进行比较
if (在老集合中的节点位置 < lastIndex),则进行节点移动操作,否则不执行该操作。这是一种顺序优化手段,lastIndex 一直在更新,表示访问过的节点在老集合中最右的位置(即最大的位置),如果新集合中当前访问的节点比 lastIndex 大,说明当前访问节点在老集合中就比上一个节点位置靠后,则该节点不会影响其他节点的位置,因此不用添加到差异队列中,即不执行移动操作,只有当访问的节点比 lastIndex 小时,才需要进行移动操作。

待补充




最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容