Redis Sentinel哨兵的基本实现原理

Redis Sentinel的三个定时任务、主观下线和客观下线、Sentinel领导者选举、
故障转移

1. 哨兵监控master节点定时器

每隔10秒,每个Sentinel节点会向主节点和从节点发送info命令获取最新的主从节点信息

  • 127.0.0.1:6379>info replication
    image.png

第一个定时器的作用

  1. 通过info主节点获取从节点信息,更新最新的拓扑图
  2. 感知新节点加入
  3. 节点异常或故障转移, 通过info更新最新节点拓扑信息


    image.png

第二个定时器的作用

  1. 每隔2秒,每个Sentinel节点会向Redis数据节点的__sentinel__:hello频道上发送该Sentinel节点对于主节点的判断以及当前Sentinel节点的信息
  2. 同时每个Sentinel节点也会订阅该频道,来了解其他Sentinel节点以及它们对主节点的判断
  3. 发现新的Sentinel节点:通过订阅主节点的__sentinel__:hello了解其他的Sentinel节点信息,如果是新加入的Sentinel节点,将该Sentinel节点信息保存起来,并与该Sentinel节点创建连接
  4. Sentinel节点之间交换主节点的状态,作为后面客观下线以及领导者选举的依据


    image.png

第三个定时器的作用

  1. 每隔1秒,每个Sentinel节点会向主节点、从节点、其余Sentinel节点发送一条ping命令做一次心跳检测,来确认这些节点当前是否可达


    image.png

主观下线和客观下线

主观判断

  • 每个Sentinel节点会每隔1秒对主节点、从节点、其他Sentinel节点发送ping命令做心跳检测,当这些节点超过down-after-milliseconds没有进行有效回复,Sentinel节点就会对该节点做失败判定,这个行为叫做主观下线
  • 可能存在误判


    image.png

客观判断

  1. 当Sentinel主观下线的节点是主节点时,该Sentinel节点会通过sentinel is-master-down-by-addr命令向其他Sentinel节点询问对主节点的判断,当超过<quorum>个数,Sentinel节点认为主节点确实有问题
  2. 从节点、Sentinel节点在主观下线后,没有后续的故障转移操作。
  3. 命令格式: sentinel is-master-down-by-addr <ip> <port> <current_epoch> <runid>
ip:主节点IP。
·port:主节点端口。
·current_epoch:当前配置纪元。
·runid:此参数有两种类型,不同类型决定了此API作用的不同。
当runid等于“*”时,作用是Sentinel节点直接交换对主节点下线的判定
  1. sentinel对主节点做主观下线后, 会向其它sentinel节点发送的命令: sentinel is-master-down-by-addr 127.0.0.1 6379 0 *返回结果包含三个参数,如下所示:
·down_state:目标Sentinel节点对于主节点的下线判断,1是下线,0是
在线。
·leader_runid:当leader_runid等于“*”时,代表返回结果是用来做主节点
是否不可达,当leader_runid等于具体的runid,代表目标节点同意runid成为
领导者。
·leader_epoch:领导者纪元。

领导者Sentinel节点选举

假如Sentinel节点对于主节点已经做了客观下线,那么是不是就可以立即进行故障转移了?当然不是,实际上故障转移的工作只需要一个Sentinel节点来完成即可,所以Sentinel节点之间会做一个领导者选举的工作,选出一个Sentinel节点作为领导者进行故障转移的工作

判定主节点客观下线后, 如何做出转移工作呢? 需要在sentinel集群中选出一个领导者, 故障转移工作交由领导工作

投票过程

每一个Sentinel都有可能成为领导者, redis借用了raft算法思想,请参考:Raft原理

  1. 当sentinel-1首先发现主节点下线, 会向其它sentinel节点发送sentinel is-master-down-by-addr命令要求投票给自己.
  2. 收到命令的Sentinel节点, 如果没有同意过其他Sentinel节点的sentinel is-master-down-by-addr命令,则会同意, 否则拒绝.
  3. sentinel-1收到票数大于等于<quorum>,就成为领导者.
  4. 如果此过程没有产生领导者,将进入下一次选举.直到选出领导者.
image.png

故障转移

领导者选举出的Sentinel节点负责故障转移

  • 在从节点列表中选出一个节点作为新的主节点, 选择方法如下:
  1. 过滤:“不健康”(主观下线、断线)、5秒内没有回复过Sentinel节
    点ping响应、与主节点失联超过down-after-milliseconds*10秒。
  2. 择slave-priority(从节点优先级)最高的从节点列表,如果存在则
    返回,不存在则继续。
  3. 选择复制偏移量最大的从节点(复制的最完整),如果存在则返
    回,不存在则继续。
  4. 选择runid最小的从节点


  • Sentinel领导者节点会对第一步选出来的从节点执行slaveof no one命令让其成为主节点。
  • Sentinel领导者节点会向剩余的从节点发送命令,让它们成为新主节
    点的从节点,复制规则和parallel-syncs参数有关
  • Sentinel节点集合会将原来的主节点更新为从节点,并保持着对其关
    注,当其恢复后命令它去复制新的主节点

如何查看日志

  • 以下日志是主观判断下线和客观判断下线.
  • sdown 是主观
  • odown 是客观, 投票数达到quorum数量则进行故障转移
62162:X 10 Jan 2020 20:05:20.216 # +sdown master mymaster 192.168.21.22 6383
62162:X 10 Jan 2020 20:05:20.269 # +odown master mymaster 192.168.21.22 6383 #quorum 2/2
62162:X 10 Jan 2020 20:05:20.269 # +new-epoch 16 #更新自己的新纪元.
# 投票给58c4052a7ab0953c4a6393be270b693b2ded243a sentinel节点, 可以在sentinel.conf配置里查看myid
62144:X 10 Jan 2020 20:05:20.276 # +vote-for-leader 58c4052a7ab0953c4a6393be270b693b2ded243a 16
-sdown master mymaster 192.168.21.22 6383 # 撤销主观判断下线.

节点下线与上线

节点下线

分临时下线(一般是维护)或永久下线(一般是换机器,升级,降级,缩容)

  1. 可以是主节点, 从节点,sentinel节点下线.
  2. 手动发起故障转移sentinel failover <mymaster>

从节点的作用

  1. 当发生故障,从节点可以切换成主节点,继续提供服务
  2. 扩展主节点的读能力.适合读多写少

sentinel支持的命令

ping、sentinel、subscribe、unsubscribe、psubscribe、punsubscribe、publish、info、role、client、shutdown

注意

哨兵模式很依赖时间, 部署各个节点的机器时间尽量要同步,否则日志的时序性会混乱,例如
可以给机器添加NTP服务来同步时间
https://www.jianshu.com/p/386815866cd4

参考

  1. https://redis.io/topics/sentinel
  2. Redis开发与运维
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,133评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,682评论 3 390
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,784评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,508评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,603评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,607评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,604评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,359评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,805评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,121评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,280评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,959评论 5 339
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,588评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,206评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,442评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,193评论 2 367
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,144评论 2 352

推荐阅读更多精彩内容