为什么需要一致性
1、在集群内部,数据不能只存在一个节点中,因为容易出现单点故障
2、保证节点间的数据一致
分布式一致性算法有哪些
1. Paxos
2. Raft
Raft协议是强一致性,去中心化的分布式协议,在Raft协议中,一个节点某一时刻都处于下面三个状态中的其中一个:
- leader
- follower
- candidate
所有节点启动时都是follower状态,在一段时间内如果没有收到来自leader的心跳,就从follower状态切换为candidate状态,发起选举,如过收到过半节点的选票(包含自己的一票),则切换到follower状态; - term
term(任期),每一次选举出了新的leader后,系统节点间的管理都是在一个新的任期内,term会累加,代表不同leader下的操作。
3. Zab
Zab协议,全称是Zookeeper Atomic Broadcast(原子广播协议),是Zookeeper专门为自己新研究的一种分布式一致性协议。在Zab协议中,一个节点某一时刻也都处于下面三个状态中的其中一种:
- Following
- Leading
- Looking
- Observing
Following表示当前节点是跟随者,服务leader节点的命令;Leading表示当前节点是Leader,负责协调事务;Looking表示节点处于选举状态,正在寻找Leader。Observer的状态就是Observing,该状态的节点不参与选举,是只读节点。
请求处理
1、Zab定义的所有请求必须有一个全局唯一的服务器来协调处理,这个服务器就叫Leader,其他剩余的服务器就叫Follower。
- Leader接收到请求后,会转换成一个Proposal,并将该Proposal分发给所有Follower,可以说是广播请求或者数据复制
- 当Leader收到过半的Follower反馈的Proposal成功ACK后就会通知所有的Follower进行Proposal的Commit。
崩溃恢复模式
一旦Leader出现崩溃或者由于网络原因导致Leader失去了与过半Follower的联系,就会进入崩溃恢复模式。
崩溃恢复模式有两个阶段:Leader选举和初始化数据,当一个Leader被选举后,这时的Leader还是一个准Leader,要经过初始化同步后才能变为真正的Leader。
消息广播模式
当Leader接收到事务请求后,会为事务赋予一个全局唯一的64位自增id,即zxid,通过zxid的大小即可实现事务的有序性过管理,然后将事务封装为一个proposal,保存到Leader本地事务中。
Leader根据Follower列表获取到所有的Follower,同时,Leader会给每一个Follower生成一个FIFO队列,然后将Proposal通过发送到FIFO队列中,经过FIFO队列再发送到对应的Follower。
当Follower接收到Leader发过来的Proposal后,会先将Proposal中的zxid和本地记录的事务日志中的最大zxid进行对比,如果Proposal中的zxid大于本地保存的最大zxid,则将proposal保存到本地事务日志中,并返回ACK给Leader。
当Leader接收到过半的Follower反馈的ACK后,Leader就会先Commit请求,然后向所有Follower队列发送Commit消息,向所有Observer的队列发送Proposal。
当Follower收到Commit消息后,就会将日志中的事务正是更新到本地。当Observer收到Proposal后,会直接将事务更新到本地。
无论是Follower还是Observer,在同步完成后都需要向Leader发送成功ACK
在zookeeper集群中,数据的传递
4. Goosip
Gossip协议
1、最终一致性
Gossip协议又叫流行病协议,是弱一致性协议。当集群中一个节点想与网络中其他节点同步一些信息时,它定期从节点集合中随机选择一个节点并交换信息,收到信息的节点也做同样的事情,最终所有节点都会有同一个份数据。当改信息定期发送到N个目标,N被称为扇出(Fanout)
2、Redis 集群加入新节点
在redis集群中添加新的节点时,使用的就是gossip协议。
MEET: 命令[cluster meet ip port],ip为新的节点ip,执行该命令后,旧节点会向新节点发出邀请,加入现在集群,然后新节点就会开始与其他节点进行通信;
PING: 节点按照配置的时间间隔向集群中其他节点发送ping消息,消息中带有自己的状态,以及自己维护的集群元数据,和部分其他节点的元数据;
PONG: 节点用于回应PING和MEET的消息,结构和PING消息类似,也包含自己的状态和其他信息,也可以用于消息广播和更新;
FAIL: 节点PING不通某个节点后,会向集群所有节点广播该节点挂掉的消息。其他节点收到消息后标记为已下线。
通过上述消息,集群中的每一个实例都能获取到其他所有实例的状态信息。这样一来,即使有新节点加入、节点故障、Slot变更等事件发生,实例间也可以通过PING、PONG消息的传递,完成集群状态在每个实例上的同步。