Memcached 与Redis (3): Redis 的集群与复制

1. Redis 集群

1.1 集群节点

  • 加入集群:
    • 节点使用cluster meet <ip> <port>命令来尝试握手, 若成功, 则加入到相应的集群中.
  • ClusterNode
    • 节点使用ClusterNode 来记录自己的状态, 并为集群中所有其它节点创建相应的clusterNode.
ClusterNode{ ctime, name, flags, configEpoch, ip, port, clusterLink};
ClusterLink{ ctime, fd, sndbuf, rcvbuf, ClusterNode*};
ClusterState{ mySelf, currentEpoch; state, size, dict* nodes}. 
  • flags 记录着Node 的角色加状态信息.
  • fd 代表tcp 描述符.
  • sndbuf 和rcvbuf 作为缓冲区 ,保存着从其它Node 发送和接收到的消息.
  • ClusterState 是以该Node 的视角来看, 集群目前所处的状态.

1.2 slot

  • 以分片的方式来保存DB中的键值对, 分为16384个slot.
  • 当所有16384个槽都有节点处理时,集群处理OK上线状态.否则为fail.
  • 记录当前Node 被指派的槽信息: clusterNode{ char slots; int numslots};
    • 其中, slots 二进制位为1时代表处理相应数值的槽.
  • 节点会在集群内相互传播槽指派信息.
    • 记录着集群中所有槽的指派信息: clusterState{ clusterNode * slots[16384]};.
    • 通过查看state.slots[i] 的值, 即可得到负责处理槽i 的Node.
  • 可以在online 状态下进行重新分片动作.

1.3 在集群中执行命令

  • 接收命令的Node 会计算出key 属于那个槽,
    • 当该槽并未被指派给自己时, 会向客户端返回MOVED 错误, 指引客户端redirect 至正确的Node.
  • 计算key 所属槽的: slot_number(key) = CRC16(key) & 16383;
  • 集群的客户端会与多个Node创建�TCP 链接, redirect 命令通过转换TCP 来完成命令的发送.
    • 如果与想要redirect 的节点还未建立TCP 链接, 会先建立后再进行转向.
    • 集群模式下的redis-cli 客户端会隐藏MOVED 错误而自动完成redirect.
    • 而单机模式下的客户端因为无法进行redirect, 会打印出MOVED错误.
  • Node 只能使用0号数据库, 而单机服务器并无该限制.
    • 记录槽和键的对应关系: clusterState{ zskiplist *slot_to_keys}.

1.4 ASK 错误

  • 在重新分片期间, 可能会出现槽的键值同时分布在源和目的节点中的情况.
  • 若源节点发现键已不在自身上, 则向客户端返回ASK错误, 来指引客户端转向正在导入槽的目标节点.

1.5 复制与故障转移.

  • master 和slave
    • master负责处理槽;
    • slave �会复制master 的数据, 并在master 下线后, 代替它继续进行处理.
  • 设置slave节点: cluster replicate <node_id>.
    • 接收者设置自己的clusterNode *slaveof属性为node_id, 同时修改flags.
    • 此时会开始从master 进行数据复制的动作: slaveof <master_ip> <master_port>.
  • clusterNode{ clusterNode *slaves, numslaves}.
    • 记录着正在复制该master的slave信息
  • 故障检测
    • 定期发送PING 消息, 若规定时间内没有返回, 则将节点标记为probable fail(PFAIL).
    • 若集群中, 若半数以上处理槽的master 都将某节点设置为PFAIL, 则该节点将被标记为FAIL, 同时进行广播.
  • 故障转移
    • 如果slave 发现master 已下线, 则开始进行故障转移.
  • 选举新的master
    • 集群的配置纪元为自增计数器, 每一次故障转移会进行自增.
    • 每个处理槽的master 都有一票, 第一个向master 要求投票的slave 将获得master 的投票.
    • 收集到大于N/2个投票的slave 会成为新的 master.

1.6 消息

  • PING消息.
    • 默认每秒发送一次.
    • 过程: 从已知节点列表中随机选出五个节点, 对其中的最长时间没有发送过PING 的节点发送该消息, 来检测其是否在线.
  • PONG消息.
    • 对MEET 和PING 的响应.
    • 或者用于让其它节点刷新对自己状态的认识
      • 如: 故障转移后新的master.
  • PUBLISH消息.
    • 节点收到后, 会执行该命令, 然后向集群广播PUBLISH 消息.

2. 复制

复制分为: 初次复制和断线后复制.

2.1 旧版的实现

  • 同步的实现.
    • master 在收到SYNC 命令后, 从后台生成RDB 文件, 并使用缓存记录从现在开始的所有写操作.
    • slave 接收并载入RDB 文件, 并接收执行缓存中记录的写操作.
  • 命令传播.
    • 在同步过后, master 会将其执行的更新命令发送给master, 说明其已达到一致状态.
    • 由于执行SYNC 命令非常耗费资源, 所以在断线后复制时效率不佳.

2.2 新版的实现

  • 完整重同步.
    • 用于初次复制, 步骤等于SYNC.
  • 部分重同步.
    • 处理断线后重复制.
    • master 只用将断线期间的更新命令发送给slave, 并让其执行.
      • master 和slave 各自维护各自的replication offset, 并分别在传播和接收传播时加上N.
        • 通过对比offset 的值来得知主从是否处于一致状态.
    • 复制积压缓存区.
      • 由master 负责维护的fixed-size 的FIFO 队列, 默认大小为1MB.
      • 进行命令传播时, 将命令写入缓存区.
      • 缓存区同时会为队列中每个字节记录相应的offset.
      • 对于断线重连的slave, 若其offset 之后的数据仍然存在于缓存区, 则使用部分重同步, 否则就需要使用完全重同步.
      • 根据slave 断线后重连的时长和master 的写命令频率来调整缓存区大小.
    • 服务器运行ID.
      • 对于断线重连的slave, 会将保存的master 的ID发送给重新连接到的master, 若相同,则可以尝试进行部分重同步.

2.3 心跳检测

  • replconf ACK <offset>.
  • 用于检测主从服务器的网络连接状态.
  • 辅助实现min-slaves 配置选项, 以防止master 在不安全状态下执行写命令.
  • 检测命令丢失.
    • 当master 发现slave 的offset 小于自己的offset, 会从复制积压缓存区中找出slave 缺失的数据并进行重发.

3. Sentinel

  • 本质上是运行在特殊模式下的Redis 服务器.
  • sentinel 成为master 的客户端, 并创建两个指向master 的异步网络连接.
    1. 命令连接. 用于向master 发送命令, 并接收命令回复.
    • 订阅连接. 订阅master 的sentinel:hello channel.
  • 获取master 信息.
    • 每隔10秒通过命令连接向master 发送INFO 命令, 然后通过分析返回�获取master 的状态.
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容