在Fabric
的论文中提到:
需要一种通信方式来保证各个节点之间的传播可信、可扩展,并且可以支持拜占庭容错。Fabric
在其框架中使用的就是gossip
协议。
Gossip协议
那么鼎鼎大名的gossip
到底是何方神圣呢?
gossip protocol
主要是在分布式数据库中各个副本节点之间同步数据时使用,这就和区块链本身的去中心化特点十分相似,而且,这种场景的一个最大特点就是组成的网络的节点都是想对等的(这个fabric
中的peer
节点是基本一致的),属于一种非结构化的网络。
使用gossip
协议的最有名的区块链项目就是Bitcoin
了(但Ethereum
则使用的是机构化网络中的DHT
算法)。
gossip
过程是由种子节点发起,当一个种子节点有状态需要更新到网络中的其他节点时,它会随机的选择周围几个节点散播消息,收到消息的节点也会重复该过程,直至最终网络中所有的节点都收到了消息。这个过程可能需要一定的时间,由于不能保证某个时刻所有节点都收到消息,但是理论上最终所有节点都会收到消息,因此它是一个最终一致性协议。
正如协议的名字一样,在传播的过程中,整个信心就像是人们口中的八卦一样,一传十,十传百,而gossip
正是拥有这样的能力。
gossip
具体实施过程中需要注意的几点如下:
1.gossip
是周期性的传播消息,我们可以对传播周期进行设定
2.被传染的节点要随机选择k
个临近点进行传播,当然这个k
值也是需要我们自己来进行设定的
3.在传播过程中,一定要注意是往未发送过的节点***传播的
4.收到消息的节点将不会再继续往发送节点传播,也就是说消息传播都是单向的
gossip
具有很多的优点:
1)扩展性
在网络中可以很容易的进行扩展,节点可以任意的增加和减少
2)容错
任何一个节点宕机都不会影响到gossip
的传播,这对分布式系统来说是一个很好的特性
3)去中心化
gossip
协议不要求任何中心节点,所有节点都可以是对等的,任何一个节点无需知道整个网络状况,只要网络是连通的,任意一个节点就可以把消息散播到全网。
4)一致性收敛
传播的方式是一传十,十传百的,速度会越来越快,可以保证在一定时间内实现所有节点的消息都收敛到一致,传播速度也达到了
5)简单
正如名字所说,整个系统实施起来就和传播流言没有任何区别
gossip类型:
Anti-Entropy
这一种称为反熵模式,即以固定的概率传播所有的数据。
Anti-Entropy
是 SI model,节点只有两种状态,Suspective
和 Infective
,叫做 simple epidemics
。
反熵这个次听起来很奇怪,但我们通过他的具体模式介绍就可以很清楚的明白,反熵的含义就是要降低节点之间的混乱程度,而实现节点间的高度相似。
在 SI model 下,一个节点会把所有的数据都跟其他节点共享,以便消除节点之间数据的任何不一致,它可以保证最终、完全的一致。
由于在 SI model 下消息会不断反复的交换,因此消息数量是非常庞大的,无限制的(unbounded
),这对一个系统来说是一个巨大的开销。
Rumor-Mongering
这一种称为谣言传播,它仅传播新到达的数据
Rumor-Mongering
是 SIR model,节点有三种状态,Suspective
,Infective
和 Removed
,叫做 complex epidemics
。
但是在 Rumor Mongering (SIR Model) 模型下,消息可以发送得更频繁,因为消息只包含最新 update
,体积更小。而且,一个 Rumor
消息在某个时间点之后会被标记为 removed
,并且不再被传播,因此,SIR model 下,系统有一定的概率会不一致。
而由于,SIR Model 下某个时间点之后消息不再传播,因此消息是有限的,系统开销小。
因此,对于每种方法该如何进行选择是需要经过长时间考虑的。
gossip中的通信模式
在 Gossip 协议下,网络中两个节点之间有三种通信方式:
- Push: 节点 A 将数据 (
key
,value
,version
) 及对应的版本号推送给 B 节点,B 节点更新 A 中比自己新的数据,在Fabric
的论文中对于这个一点也有较为详细的论述 - Pull: A 仅将数据
key
,version
推送给 B,B 将本地比 A 新的数据(Key, value, version)
推送给 A,A 更新本地 - Push/Pull: 与
Pull
类似,只是多了一步,A 再将本地比 B 新的数据推送给 B,B 则更新本地