Zookeeper是一个分布式应用程序协调服务的Apache项目,主要负责集中维护配置信息的服务,提供分布式的同步机制,其所有的服务都是做为其他分布式应用的基础,是现在很多分布式应用的重要组件。
从设计模式角度,zookeeper是一个基于观察者模式涉及的分布式服务管理框架,它负责存储和管理大家都关心的数据,然后接收观察者的注册,一旦这些数据的状态发生变化,zooker就将负责通知在zookeeper上注册的哪些观察者做出相应的反应。
Zookeeper的特点
1)一个领导者多个跟随者组成的集群
2)集群中只要有半数以上节点存活,zookerper集群就能正常服务
3)全局数据一致
4)更新请求顺序进行,来自同一个Client的更新请求按其发送顺序依次执行
5)数据更新原子性,一次数据要么全部成功,要么全部失败
6)实时性,在一定时间范围内,Client能读到最新数据
数据结构
Zookeeper数据模型的结构与Unix文件系统类似,整体上可以看作一棵树,每个节点称作一个ZNode,每一个Znode能够存储1MB数据,每个ZNode都可以通过其路径唯一标识。
配置文件
#集群启动前,leader和follow通信时间:10*2s
tickTime=2000
#集群启动后,leader和follow通信时间:5*2s
initLimit=10
syncLimit=5
dataDir=/usr/local/bin/zookeeper-3.4.14/dataDir
dataLogDir=/usr/local/bin/zookeeper-3.4.14/logDir
clientPort=2181
应用场景
Zookeeper主要提供以下几种服务:统一命名服务、统一配置管理、统一集群管理、服务器节点动态上下限,软负载均衡等。
Zookeeper内部原理
选举机制
1)半数机制:集群中半数以上机器存活,集群可用,所以zookeeper适合安装奇数台服务器
2)Zookerper虽然在配置文件中没指定Master和Slave,但是Zookeeper工作时有一个节点为Leader,其他则为Follower,Leader是通过内部的选举机制临时产生的
每台服务器上线后,先投自己一票,选自己后依旧没产生Leader的话,就将选票投给id最大的服务器,在产生Leader后,Leader就固定下来了,正常运行不会再改变,所以图示Leader是Server3。
节点类型
1)持久(Persistent):客户端和服务器端断开连接后,创建的节点不删除
2)短暂(Ephemeral):客户端和服务器端断开连接后,创建的节点自己删除
监听器原理
1)首先要有一个main线程
2)在main线程中创建zookeeper客户端,这时就会创建两个线程:一个负责网络连接通信(connet),一个负责监听(listenner)
3)提供connet线程将注册的监听事件发送给zookeeper
4)在zookeeper的注册监听器列表中将注册的监听事件添加到列表
5)Zookeeper监听到有数据或路径变化,就会将这个消息发送给listener线程。
6)listenner线程内部调用process()方法
常见的监听:监听节点数据的变化get path [watch]
、监听子节点增减的变化ls path [wathc]
写数据的流程