1. Sentinel 哨兵
Sentinel(哨兵)是Redis 的高可用性解决方案:由一个或多个Sentinel 实例 组成的Sentinel 系统可以监视任意多个主服务器,以及这些主服务器属下的所有从服务器,并在被监视的主服务器进入下线状态时,自动将下线主服务器属下的某个从服务器升级为新的主服务器
在Server1 掉线后:
升级Server2 为新的主服务器:
2. Redis 主从
在讲解Sentinel 哨兵集群之前,我们先来搭建一个简单的主从分离(读写分离)。
首先,我们默认大家都已经安装了redis,然后我们将 redis.conf 拷贝多份,并且创建多个目录,用于区分多个redis 服务,这里面,每个目录中都有自己的redis.conf 配置文件,接下来,我们先设置主服务器的配置文件:
一、配置Master
- 修改端口
port 6380
- 修改 pidfile
pidfile /var/run/redis_6380.pid
- 启动并查看
redis-cli -p 6380 127.0.0.1:6380> info ... # Replication role:master connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0 ...
二、配置Slave
和上面配置 master 一样,我们需要修改端口号和 pid 文件,在修改完之后,我们有两种方法配置从服务:
-
在配置文件中配置从服务
slaveof 127.0.0.1 6380 # 如果 master 节点有设置密码 masterauth <master-password>
-
在服务启动后设置
127.0.0.1:6382> slaveof 127.0.0.1 6380 //修改后状态 # Replication role:slave master_host:127.0.0.1 master_port:6380 master_link_status:up master_last_io_seconds_ago:1 master_sync_in_progress:0 slave_repl_offset:617 slave_priority:100 slave_read_only:1 connected_slaves:0 master_repl_offset:0 repl_backlog_active:0 repl_backlog_size:1048576 repl_backlog_first_byte_offset:0 repl_backlog_histlen:0
我们可以可以看到,两个从服务已经在连着主服务器,上面两种配置的区别在于,当 salve 断线重连之后,如果我们是修改类配置文件,重连之后会自己链接上去master,并且同步master 上面的数据,如果我们是手动连接上去的主服务器,重连之后,从服务器会读取自己本地的 rdb 回复数据,而不会去自动链接主服务。
我们如果需要设置读写分离,只需要在主服务器中设置:
slave-read-only yes
3、Sentinel 哨兵
-
配置端口,在 sentinel.conf
port 26379
配置文件中修改。一般情况下,至少会需要三个哨兵对redis 进行监控,我们可以通过修改端口启动多个sentinel 服务。
-
配置主服务器的ip 和端口,我们把监听的端口修改成6380,并且加上权值为2,这里的权值,是用来计算我们需要将哪一台服务器升级升主服务器。
sentinel monitor mymaster 127.0.0.1 6380 2
-
启动 Sentinel。
/sentinel$ redis-sentinel sentinel.conf
sentinel 启动之后,就会监视到现在有一个主服务器,两个从服务器。
当我们把其中一个从服务器器关闭之后,我们可以看到日志,日志表示,6381这个从服务器已经从主服务器中脱离了出来:
10894:X 30 Dec 16:27:03.670 # +sdown slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 6380
我们重新把6381 接回去。
10894:X 30 Dec 16:28:43.288 * +reboot slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 6380
10894:X 30 Dec 16:28:43.365 # -sdown slave 127.0.0.1:6381 127.0.0.1 6381 @ mymaster 127.0.0.1 6380
-
关闭 Master 节点,我们手动关闭Master 之后,sentinel 在监听master 确实是断线了之后,将会开始计算权值,然后重新分配主服务器。
我们可以看到,6380主服务器断了之后,sentinel 帮我们选了6382作为新的主服务器。
-
重连 Master,大家可能会好奇,如果master 重连之后,会不会抢回属于他的位置,答案是否定的,就比如你被一个小弟抢了你老大的位置,他肯给回你这个位置吗。因此当master 回来之后,他也只能当个小弟。
4. Sentinel 总结
一、Sentinel的作用:
- Master 状态监测
- 如果Master 异常,则会进行Master-slave 转换,将其中一个Slave作为Master,将之前的Master作为Slave
- Master-Slave切换后,master_redis.conf、slave_redis.conf 和 sentinel.conf的内容都会发生改变,即 master_redis.conf 中会多一行slaveof的配置,sentinel.conf 的监控目标会随之调换。
二、Sentinel的工作方式:
- 每个Sentinel以每秒钟一次的频率向它所知的Master,Slave以及其他 Sentinel 实例发送一个 PING 命令
- 如果一个实例(instance)距离最后一次有效回复 PING 命令的时间超过 down-after-milliseconds 选项所指定的值, 则这个实例会被 Sentinel 标记为主观下线。
- 如果一个Master被标记为主观下线,则正在监视这个Master的所有 Sentinel 要以每秒一次的频率确认Master的确进入了主观下线状态。
- 当有足够数量的 Sentinel(大于等于配置文件指定的值)在指定的时间范围内确认Master的确进入了主观下线状态, 则Master会被标记为客观下线
- 在一般情况下, 每个 Sentinel 会以每 10 秒一次的频率向它已知的所有Master,Slave发送 INFO 命令
- 当Master被 Sentinel 标记为客观下线时,Sentinel 向下线的 Master 的所有 Slave 发送 INFO 命令的频率会从 10 秒一次改为每秒一次
- 若没有足够数量的 Sentinel 同意 Master 已经下线, Master 的客观下线状态就会被移除。
- 若 Master 重新向 Sentinel 的 PING 命令返回有效回复, Master 的主观下线状态就会被移除。