《A Gossip-Style Failure Detection Service》阅读笔记

A Gossip-Style Failure Detection Service

三种不同的gossip协议

  1. basic protocol:每一个周期,随机选取一定数量的已知节点交换信息。redis的集群的实现基本上就是这个。
  2. Multi-level Gossiping:每一个节点配置子网信息,这样在选取节点发送gossip消息的时候,不同的子网平均每次选择一个节点,相同的子网可以选取多个节点。这样可以大大地减少网络上的流量。
  3. Catastrophe Recovery:第三种协议是在第二中协议的基础上加上了对整个子网进行广播的逻辑。这样在网络节点发生大规模故障的时候可以及时地发现。

几个结论(基于basic protocol)

failure节点与detection time之间的关系

从图中可见,当failure节点的数量不是很多得时候,很快就可以发现failure节点


failure节点与detection time关系图
mistaken probability与detection time之间的关系

从图中可见,假如mistaken probability在集群越大的时候,对detection time的影响就约大。但是,这两个参数,是一个你死我活的关系,因此,一般来说需要对这两个值取一个平衡值。

mistaken probability:The probability that an process is not infected by any other process.

mistaken probability与detection time关系图
failed members与detection time之间的关系

从图中,可见,当集群发生大规模故障的时候,detection time就会剧增,导致failure detection service基本上无效。


failed members与detection time关系图
丢包率与detection time之间的关系

从图中可见,detection time基本上不受丢包率的影响。并且实际上,丢包率是非常非常之低的,小于0.05.


丢包率与detection time关系图
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • “安迪!你没事吧?”曲筱绡带着姐妹们来到安迪的病房,“没事!”“呼…那就好急死我了!包大哥你怎么没看好呢!要...
    LT_Tamia_92e5阅读 604评论 1 0
  • 一直以来,生病后,我不选择打针,小小的针尖,刺入皮肤,很可怕的样子,打针时要磨叽半天,好说歹说地才肯扎。宁肯自己头...
    如水如沐阅读 296评论 2 1
  • 感赏儿子晚上过来同我们说要开始好好读书,考个好的高中,达成目标后要独自出门旅行一段时间,孩子还是很想要一个美好的未...
    zhangxiaoyu阅读 156评论 0 0