背景介绍
计算机CPU的计算速度提高(频率的提高)是有限度的,我们能做的是放入多个计算核心。为了利用多核心的计算机,我们需要并发执行。但是多线程的方式会引入很多问题和增加调试难度。我们有个替换的方案,叫做Actor模型。
Actor模型和Actor
Actor模型是处理并行计算的概念模型。它定义了系统部件行为和交互的一些规则。使用这个模型的最著名的编程语言是Erlang。
模型中一个Actor是一个基本的计算单元。它接受消息然后基于接到的消息做一些计算。和面向对象编程有些类似,一个对象被调用(接收到一个消息),基于调用方法(接受到的一个消息)做处理。区别是actor之间是完全隔离的,不共用内存区域。actor的私有状态不会被另外一个actor直接改变。
actor作为群体存在,单一的actor不是actor模式。在actor模型中,actor是唯一组成部分,actor带有地址以便互相发送消息。
actor按次序处理消息,比如你发送三个消息给一个actor,它们不会被并发处理。如果你想让这三个消息得到并发处理,你需要创建3个actor,然后分别发送给它们。
接受到的异步消息存在于actor内部的一个队列中,我们可以把它形象化的叫做邮箱(mailbox)。
actor的行为
当一个actor接受到消息后,它可以做如下事情:
- 创建更多的actor
- 发送消息到其他actor
- 指派对下一条消息做什么处理。
最后一条定义了actor如何操作内部状态。例如一个计算器作用的actor,初始状态是0,处理到加1消息时,它不改变内部状态,但分派下一条消息处理时,状态是1.
失败可容忍
Erlang语言中有个“由它失败”的思想。就是你不可能考虑到所有导致失败的问题,与其绞尽脑汁处理这些问题,不如让它自然失败,然后指派给失败处理者处理(例如恢复到稳定状态),在actor模型中,这是可行的。
actor之间的隔离性导致actor失败不会影响其他actor,监控者可以对自然失败的actor做直接处理而不会带来连锁问题。这让“自愈系统”成为可能,就是说一个actor异常后,监控者可以恢复一致性,可能以初始状态重起actor。
分布性
actor发消息时不在乎目标actor是本地运行的还是运行在其他节点。试想,如果actor只是只有内部状态的邮箱,只对消息做出反应,那就没人在乎它在哪里运行,知道有个地址让消息可以到达即可。这让我们可以创建分布式系统,并且在节点失败时独立恢复而不影响整个系统。
进一步建议看一下Erlang和Elixir语言, JVM上的 Actor库Akka,基于Actor的框架Vert.x