浏览器架构的发展简史

预备知识

要想了解浏览器架构的发展历史,我们首先需要了解一下进程线程的特性

基础知识

进程可以理解为一个运行中的程序,线程则存在于进程中。

进程是系统进行资源分配的最小单元,也就是说,线程无法单独的获取系统的资源,需要使用其所在的进程的资源。

image

线程由进程创建而存在,当进程销毁时,正在运行的线程也会自动销毁

image

单线程 vs 多线程

一个进程处理任务时,可以采用单线程也可以采用多线程,对于多核属于标配的时代,使用多线程处理程序,可以极大的提升处理性能

比如,我们要计算下面三个表达式的值,并显示出结果来

A = 1 + 2
B = 20 / 5
C = 7 + 8 
console.log(A, B, C)

使用单线程处理时,我们可以把这个过程拆分为四个任务

  • 任务1 计算 A = 1 + 2
  • 任务2 计算 B = 20 / 5
  • 任务3 计算 C = 7 + 8
  • 任务4 显示最后的结果

如果采用多线程,经过分析,我们发现这四个步骤中,前三个任务之间是独立的,可以并行执行,第四个任务则需要等待前三个任务结束后,方能执行。因此我们可以将其分成三个线程来处理。

三个线程分别处理前三个任务中的一个,然后选择一个线程来处理最后一个任务就好。

image

但是有一点需要注意,只要有一个线程奔溃了,那么整个进程都会奔溃。

通信

线程间通信

同一个进程的线程之间可以共享进程的公共数据,以便于进行读写操作。
image

进程通信

对于进程间通信,则略为复杂一些,需要使用IPC进行通信(图中黑色虚线)。

image

要点总结

从以上的知识点中,提取出对下文有直接影响的几个点。

1. 进程中的任意一个线程出错,都会导致整个进程的奔溃

2. 线程之间共享进程中的数据

3. 当一个进程关闭后,操作系统会回首进程占用的内存

进程关闭后,系统会回收所有的资源,哪怕是由于操作不当,引起的内存泄露问题,内存也会被正确回收

比如早期的ie浏览器,支持很多插件,而这些插件很容易造成内存泄露,这意味着只要浏览器开着,内存 占用就会越来越多,所以需要关闭浏览器,重新打开,从而让这些内存被回收掉

4. 进程之间互相隔离

由于进程之间是互相隔离的,从而保证了进程的独立性。当一个进程发生奔溃时,不至于影响其他进程。进程之间需要通信的话,可以使用IPC技术

浏览器架构进化史

由于chrome拥有着极大的市场占有率,在多进程时代我们将以chrome为案例进行解析。

单进程时代

故名思义,单进程浏览器就是将所有功能都放在一个进程中来实现。

在该浏览器进程中,采用多线程技术,将不同的功能使用不同的线程来实现,比如网络线程页面线程等。

image

如何多的功能运行在同一个进程中,会导致浏览器不稳定、不流畅、不安全等问题。

问题1:不稳定

浏览器中的许多强大功能需要借助于插件来实现,但是插件是第三方提供的,非常容易出现问题。

同时,除去插件容易出现问题,页面线程中的javascript也非常容易出现问题。

线程进程之间的描述中,可以知道,一个线程的奔溃,会导致整个进程的奔溃。

问题2: 不流畅

这个不流畅所指的不仅仅是当前页面的不流畅,还有整个浏览器的不流畅。

从上图中,我们得知,所有页面的渲染模块js的执行模块插件都运行在同一个线程中,这也就是说,同一个时刻只能有一个模块在执行。

比如,下面这个无限循环的脚本:

function freeze() {
    while(true) {
        console.log('freeze');
    }
}
freeze();

当这个脚本执行在一个单进程的页面的时候,由于其是无限循环的,所以会一直执行,从而导致其他模块没有机会执行代码。又因为所有页面都运行在这个线程中,所以其他页面也无法执行任务,从而导致整个浏览器失去相应,变卡顿。

问题3:不安全

由于是单进程,同时浏览器需要系统资源的支持,比如读写cookie等,所以我们无法使用沙箱技术来进行隔离,那么如果是恶意插件和js代码的话,会引发安全问题。

插件可以使用C/C++等语言来书写,通过插件可以获取到系统的任意资源,也就意味着该插件可以完全操控电脑。如果是一个恶意插件,那么它就可以窥探隐私释放病毒等,从而引发安全性问题。

以上这些就是当时浏览器的特点,不稳定,不流畅,而且不安全。这是一段不堪回首的过去,也许你没有经历过,不过你可以想象一下这样的场景:当你正在用浏览器打开多个页面时,突然某个页面崩溃了或者失去响应,随之而来的是整个浏览器的崩溃或者无响应,然后你发现你给老板写的邮件页面也随之消失了,这时你的心情会不会和页面一样崩溃呢?

多进程-早期时代

这是2008年chrome发布时的进程架构。

image

从图中,我们可以发现,chrome将渲染模块和插件模块单独封装到了进程中,进程之间通过IPC进行通信。

我们来一一分析一下,它是如何解决单进程浏览器的三大问题的。

  1. 不稳定问题

    插件渲染模块被单独封装到了进程中,那么当一个插件或者一个tab页面奔溃的时候,不会影响到其他插件模块渲染模块,也不会将这个浏览器搞到奔溃,从而解决了不稳定的问题

  2. 不流畅问题

    同理,由于插件渲染模块在主进程中的剥离,那么当某一个插件、页面发生阻塞的时候,不会影响到浏览器,也不会影响到其他的插件和页面

  3. 不安全问题

    采用多进程后,我们可以使用沙箱技术对插件进程和渲染进程进行隔离,这样即使渲染进程或者插件进程执行了恶意程序,其也无法获得系统权限。

多进程-现状

随着chrome的发展,架构又有了新的变化。

chrome进一步的将主进程中一些服务进行了剥离,比如网络GPUAUDIO等。

image

这里简单的对这几个进程进行一下介绍

  • 浏览器主进程

    • 负责界面展示,与用户交互。如前进、后退、书签等
    • 负责各个页面的管理,协调各个进程
    • 。。。
  • 渲染进程

    负责将HTML,CSS,JS转换为网页。

    排版引擎blink,js引擎V8都是运行在该线程中。

不过凡事都有两面性,虽然多进程提升了浏览器的稳定性、安全性、流畅性,但是同样也带来了一些问题:

  • 更高的资源占用

  • 更复杂的体系架构

浏览器各模块之间耦合性高、扩展性差等问题,会导致现在的架构已经很难适应新的需求了

对于这两个问题,chrome团队已经着手进行解决了,那就是面向服务架构

未来面向服务的架构

chrome整体架构采用现代操作系统所采用的面向服务的架构方向发展,将原来的各种模块,抽取、重构成独立的服务,每个服务都可以在独立的进程中运行,每个服务都会提供访问接口,通过IPC来通信,从而构建高内聚,低耦合,易于维护和扩展的系统

chrome最终要把UI,数据库,文件,设备,网络等模块重构为基础服务,类似于操作系统的底层服务。

image

目前chrome正处于老的架构向服务化架构过度阶段,这将是一个漫长的过程。

chrome要做的事情,类似于操作系统正在做的事情,我们甚至可以认为chrome是一个便携式操作系统

chrome还提供了弹性方案,当运行于资源受限的设备上的时候,会自动将服务整合到一个进程中,从而减轻设备的压力。

image

总结

本文主要从chrome的角度对浏览器的架构进行了分析。

最初的浏览器是单进程的,他们不稳定,不流畅,不安全,之后出现了chrome,创造性的引入了多进程架构。随着chrome应用到越来越多的场景,功能也越来越复杂,原有的架构已经不能满足于场景的快速变化,chrome团队采用了面向服务架构(SOA)进行逐步重构,目前仍然在进行中。

参考文章

https://juejin.im/post/5bd7c761518825292d6b0217

https://time.geekbang.org/column/article/113513

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 这是一座阴雨绵绵的小城,今天以前,我似乎觉得太阳已经抛弃了这座小城。十多天的层云细雨加低温,让我这个北方的女子感觉...
    易紫菀阅读 2,948评论 4 4
  • 一、学习与实践 1.付出不亚于任何人的努力 2.要谦虚,不要骄傲 3.要每天反省 4.活着,就要感谢 5.积善行,...
    015058阅读 1,436评论 0 1
  • 茧丝线般晶莹剔透,细细的长, 缠缠绕绕呀缠呀绕呀, 什么时候到头? 到不了头了,就这样沉溺, 沉溺进那甜蜜的苦楚,...
    杨子今阅读 1,664评论 0 1
  • 一早起得特别早,和书吧的书友一起去香港书展,8:30到少年宫集合。 拖拉的个性还是导致7:00出门,昨天导航说大概...
    君子如玉Anny阅读 890评论 0 1
  • 我替他可惜,聪明的孩子,就这样被生活中无情的意外毁了,我也不清楚毁掉他的是身世,还是父亲的离世。 小学五年级的时候...
    红色郁金香阅读 1,436评论 0 2