Distributed Publish Subscribe in Cluster
通过了解Akka集群后,我们可能会产生两个问题
如果我们要发送消息到某个actor但是我们不知道它在哪个节点运行,该如何发送?
如果我们要给订阅某种Topic的所有actor发送消息,该如何发送?
于是Akka提供了一个中介actor:
akka.cluster.pubsub.DistributedPubSubMediator
它在所有的节点上启动,用来管理actor引用的注册表(比如,将actor的id与其actorRef对应存入Map中 )。而且这些注册表是具有最终一致性,当某个节点发生变化,这个节点上的mediator不会立即通知其他节点,而是将变化的信息进行版本化,几秒后通过gossip 协议将变化的增量 复制到其他节点的mediator。
因此你就可以通过任意一个节点上的mediator 来向任何其他节点的actor通信
对于一开始的两个问题,mediator有两种消息传递模式:Publish与Send,下面将介绍具体的实现方法和过程。
Publish
这是一种 Pub/Sub 模式(如聊天室),
通过DistributedPubSubMediator.Subscribe方法来将订阅这个主题的actor注册到本地的mediator中。
通过 DistributedPubSubMediator.SubscribeAck 和DistributedPubSubMediator.UnSubscribeAck 确认是否订阅成功,一段时间后会将该订阅变化复制到其他节点的mediator
最后我们向本地的mediator发送DistributedPubSubMediator.Publish就可以将消息发布给所有订阅的actor
如果actor被终止,它将在订阅的注册表中被自动移除。
actor也可以用group id 来进行订阅,发布的这个主题的消息就会向每个group中随机选一个actor发送。如果恰好订阅消息的都是同一个group 的actor。那么mediator只需要发送到其中一个actor就可以。
使用sendOneMessageToEachGroup (true/false)可以设置是否将消息发送给使用group id订阅的actor。
Send
则是一个 point-to-point 模式(例如 私聊),每个消息都会投递到一个目的地,即使你不知道目的地在哪里。
发送的消息会通过一个匹配路径(因为不知道目的地在哪,所以该路径不带有地址信息)来发给mediator。节点中的每个actor通过DistributedPubSubMediator.Put 将其ActorRef注册到本地的mediator中,所以在本地actor system中路径是唯一的,通过path关键字即可找到目的actor。
换句话说,匹配路径(path)=逻辑路径,地址信息(address)=物理路径。mediator 通过将带有逻辑路径的消息广播给各个节点actor system。因为在每个actor system中actor 的路径是唯一的,所以消息只需要知道actor的逻辑路径就可以找到相应的actor来发送消息。
如果有多个actor与path匹配(具有相同path的actor可以在不同的节点上注册),将使用RoutingLogic (默认随机)发送到其中一个。(可以设置本地偏好,优先选择本地的mediator进行发送)
用DistributedPubSubMediator.Send发给mediator带有path的消息
同样如果某个actor被终止,它将会在注册表中自动删除。
如果DistributedPubSubMediator.SendToAll ,可以实现消息广播,将消息发给所有匹配路径的actor
实现上面的两种模式都是通过mediator扩展DistributedPubSub 来实现,当然mediator也可以是一个普通的actor。
akka.extensions = ["akka.cluster.pubsub.DistributedPubSub"]
在分布式发布订阅模式中只保证at-most-once delivery ,因此消息可能会丢失。
如果想要at-least-once投递保证,推荐Kafka Akka Streams integration
依赖
sbt:
"com.typesafe.akka" %% "akka-cluster-tools" % "2.4.16"
maven: