多机数据库的实现
复制
启动主从的方式是
SLAVEOF 127.0.0.1 6379(主库地址)
- 复制功能的实现是怎么实现的?
复制功能主要是三方面功能,
完整重同步,部分重同步,命令传播。
其中完整从同步是通过传输RDB文件去进行同步的。
而部分重同步是利用复制偏移量+复制挤压缓冲区存储的命令队列实现的。
消息传播是主服务器收到客户端的写命令或者是key值过期的时候,给从服务器发送相同的写命令,来保证主从同步的。
其中当主从复制偏移量超过了缓冲区存储的最大队列之后,就会采取完整重同步进行同步。
哨兵模式
哨兵模式是通过将某个redis服务器提升为一个哨兵,由这个哨兵对其他的redis进行监控,当主redis发生故障被哨兵检查出来的时候,哨兵能自主进行故障转移。
- 故障转移是怎么做的?
- 挑选主redis的其中一个从服务器,将这个从服务器升级为主的服务器。
- 向其余的从redis发送新的复制指令,指向新的数据库主库。
- 如果下线的曾经主redis又起来了哨兵会让他成为新的主redis的从节点。
- 哨兵是如何对节点进行监控的?
哨兵对redis服务器建立两条链接,一个是命令链接,一个是订阅链接。
然后哨兵每秒一次对所有的redis实例发送ping命令来判断redis是否下线,如果redis实例没有正常返回,哨兵对这个实例判定为主观下线。当多个哨兵对同个redis实例做出主观下线的判断时,就会变成客观下线,然后由主哨兵进行故障转移。
- 主哨兵是怎么选出来的。
通过raft算法实现的。
- 多个哨兵是如何进行消息共享的?
哨兵每两秒一次对所有的redis实例发送一条广播消息,而这条广播消息会被其他的多个Sentinel实例所发现,用来更新其他哨兵对发送消息的哨兵的认知。
然后当哨兵通过广播消息,发现新的哨兵,会跟新哨兵建立链接,多个哨兵会对共同承担监控任务。
- 哨兵是如何发现从服务器的?
哨兵是通过对主服务器发送INFO,查看Replication下面的从redis属性发现的。
- 当哨兵发生故障转移的时候客户端怎么感知的?
redis客户端不像单点那么简单实现,redis客户端会监听哨兵的频道,redis根据哨兵广播的消息去连接redis实例,如果发生故障转移的话,哨兵会广播消息通知到客户端,让客户端去连接新的主redis。
集群
redis的集群是通过分片实现的。
是通过CLUSTER MEET命令来实现各个几点之间集群的建立的。
通过CLUSTER MEET命令,各个节点保存了其它节点相关的消息,内容包括集群的,各个节点的ip端口,在线情况,包含多少节点,配置纪元,处理的槽节点的数量和范围,节点名称。
redis一致性使用的协议是gossip。
- 集群之间相互连接好了之后集群就启动了么?
并不是的,集群启动之后还需要对集群进行槽指派,集群将整个数据库被分为16384个槽,只要有一个槽没有指定到特定的redis中的话,那么这个集群还是下线状态的。
槽指派命令是:CLUSTER ADDSLOTS。进行槽指派之后,整个集群才算正式上线。
- 那客户端跟集群是如何通讯的?
客户端可以跟集群中的任意节点进行通讯,如果该key所对应的槽正好是当前节点,那么节点直接执行这个概念,如果对应的是其它节点,那么会对客户端发送一个move错误,带上这个槽对应的节点信息,引导客户端去连接正确的节点。
- 集群和单机redis的区别?
集群模式下的节点,只能使用0号库。
- 再分片的实现?
redis重新分片是通过redis集群管理软件进行操作的。
在进行再分片的时候,客户端再查找key的时候,可能key已经被分配到新节点上了,这个时候源节点就会发送给客户端一个ASK错误,让客户端转向新的节点查找。
- ASK和MOVE错误的区别
move值的是已经确认了的key的位置,下次遇到关于槽的请求命令时,都是可以直接将请求发送到move所指的节点的。
而ASK只是一种临时措施,所影响的只会是下次请求的指向。
复制与故障转移
如果集群中有个节点下线了,集群中的其它节点会从该节点的从节点中,挑选一个节点,让其提升为主节点。
- 集群中的节点如何检测出节点挂了?
集群中的每个节点都会定期地向其它加点发送ping消息,如果ping消息没有在规定的时间内收到回应,那么节点A判断没有收到回应的节点B疑似下线,然后该节点A在共享节点消息的时候会通知到其它节点。如果其他节点C发现A认为B下线了,C也发现A下线了,此时如果发现半数以上的节点都认为B下线了,那么会把B标记为已下线,并广播一条B节点 Fail的消息。
- 如何发生故障转移的时候,如何挑选从节点?
当从节点发现自己的主节点下线时,会向集群广播一条消息,该消息会导致集群中的其它节点判断是否给该从节点投票。其它节点要是还没有投票给其它从节点,那么他就会投票给这个从节点。如果一个从节点收到N/2+1张票(N为节点数)时,成为新的主节点,如果没有一个从节点收到这么多票,会进行一个新的选举流程。这是基于Raft算法的选举流程。