redis cluster

redis cluster特性

  1. 对于每一个节点,都需要配置master,slave。当master down掉的时候,其它仍然alive的节点会promote slave节点作为master节点。关于节点的功能还有auto-discover other nodes, detect non-working nodes

关于configEpoch

感觉configEpoch是类似于一个版本号的东西,是关于cluster slot的一个版本号。一般来说,每一个master节点的configEpoch都是不同的(假如存在相同的configEpoch,会有冲突处理算法来保证每个节点的configEpoch不同),并且每一个节点的configEpoch不会轻易发生改变(节点改变的情况见下面)。由于configEpoch是单调递增的,因此当某一个节点的configEpoch改变之后,其它节点就会更新对该节点所声称拥有的slots的认识。

关于currentEpoch

configEpoch只是关于slots分布的一个版本号,而currentEpoch才是真正的逻辑时钟。通过gossip协议,集群中的currentEpoch总是一致的(当然,特殊情况除外,如网络分区发生等)。currentEpoch越高,代表节点的配置或者操作越新。

redis cluster中得逻辑时间

  • configEpoch : configEpoch should be generate by concensus and should be unique across the cluster(configEpoch可以看做是一个逻辑时间戳)
  • currentEpoch

configEpoch的变化

  1. 在集群初始化的时候,通过读取配置文件nodes.conf中的configEpoch值,对每一个节点的configEpoch进行赋值
  2. 集群重置(resetCluster)时,configEpoch被置为0
  3. 当一个槽迁移到某一个节点之后,尤其是集群发生resharding的时候;当发生failover force时,节点的configEpoch会被置为currentEpoch + 1(原因未清楚)
  4. 若两个节点的configEpoch相同,并且当前节点的nodename更大,则当前节点的configEpoch=currentEpoch+1(configEpoch发生冲突时的处理)
  5. 当master发生fail的之后,slave获得大多数master的投票时,设置slave的configEpoch为failover_auth_epoch
  6. cluster set-config-epoch命令强制设置configEpoch
  7. 当接受到其它节点发来的gossip消息的时候,设置configEpoch为消息中得configEpoch

投票的条件

  1. 发起投票的节点必须是slave节点,并且它的master节点已经down掉
  2. 发起投票节点的currentEpoch不低于投票节点的currentEpoch
  3. slave节点的configEpoch不低于投票节点特定slots的configEpoch(这些特定slots是指投票节点知道的down掉得master节点所拥有的slots)

注意事项

  • 在retarding过程中,设计多个key的操作可能失败。
  • 任意一个节点都可以接受客户端请求,但是假如请求的key不在本节点,会发送一个MOVED相应。并且,应该客户端来缓存key->node的对应关系。

写数据丢失的可能行

  1. master接受写请求后,在没有将新数据同步到slave之前,master down掉,这部分数据丢失。(这跟单机的情况一样)
  2. master由于网络分区而被slave failover,slave成为了master,然后网络分区消失,原来的master又重新与集群连接上了(这是原来的master的configuration仍然是master)。假如client将写请求发送给这个master,写请求会被接受,但是会丢失。原因在于很快,现在的master会将原来的master降级为slave。
  3. 另外,假如网络分区发生后,并且很长一段时间没有恢复,那么在NODE_TIMEOUT时间内发送给minority分区中得master的写也会丢失。因为在分区发生后的NODE_TIMEOUT时间内fail detection不会检查出有节点unreachable,写请求仍可接受。在NODE_TIMEOUT时间后,fail detection检查到有节点unreachable,就不接受写请求了。

redis cluster specification上的话

Very high performance and scalability while preserving weak but reasonable forms of data safety and availability is the main goal of Redis Cluster.

如何避免gossip消息成指数级增长

注:这里的指数增长主要是指节点数跟gossip消息数的关系。

  1. 每10个clusterCron(约1s)可能会随机挑选一个节点发送ping
  2. 在接收到节点的pong消息(node_timeout / 2)s后回给该节点发送一个ping消息
  3. 每接受到一个ping消息,回复一个pong消息。

因此,正常情况下一个node_timeout时间内,一个节点可以跟另外的节点交换至少4个包(大家互相ping一次,互相pong一次)。那么集群中总共发送的数据包是$$\dfrac{(N + 1) * N * 4}{2} = (N + 1) * N * 2$$增长率是$$2 * (2 * N + 1) = 4 * N + 2$$

从数字上来看,这gossip包得数量还是很惊人的;指数的gossip是多少?

根据实际测试,使用create-cluster脚本创建的集群,大概每10每个节点会发送100个包(默认的node_timeout是15s)。在数量级上跟上述列出的公式是一致的。个人觉得redis cluster在gossip协议上还是有优化的空间的,怎么样在保证及时性和准确性的情况下减少gossip协议的消息数量

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容

  • Redis Cluster Redis Cluster是Redis官方在Redis 3.0版本正式推出的高可用以及...
    Springlin阅读 3,777评论 1 5
  • 本文将从设计思路,功能实现,源码几个方面介绍Redis Cluster。假设读者已经了解Redis Cluster...
    CatKang阅读 1,456评论 0 2
  • 基本目标与设计基本思想 Redis cluster 目标 高性能,并且能线性扩展到1000个节点。不需要代理,使用...
    tafeng阅读 2,761评论 0 0
  • 转发:Redis Cluster探索与思考 Redis Cluster的基本原理和架构 Redis Cluster...
    meng_philip123阅读 3,584评论 0 14
  • Redis Cluster原理分析 文章较长,如需转载可分段。转载请标明作者以及文章来源,谢谢! 作者介绍 姓名:...
    lihanglucien阅读 20,449评论 3 30