1、什么是Zookeeper?
Zookeeper是一个分布式的,开放源码的分布式应用程序协同服务。
Zookeeper的设计目标是将那些复杂且容易出错的分布式一致性服务封装起来,构成一个高效可靠的原语集,并以一系列简单易用的接口提供给用户使用。
2、Zookeeper发展历史
Zookeeper最早起源于雅虎研究院的一个研究小组。在当时,研究人员发现,在雅虎内部很多大型系统基本都需要依赖一个类似的系统来进行分布式协同,但是这些系统往往都存在分布式单点问题。
所以,雅虎的开发人员就开发了一个通用的无单点问题的分布式协调框架,这就是Zookeeper。Zookeeper之后再开源界被大量使用,下面列出了三个著名的开源项目是如何使用Zookeeper的:
- Hadoop:使用Zookeeper做Namenode的高可用
- HBase:保证集群中只有一个master,保存hbase:meta表的位置,保存集群中的RegionServer列表
- Kafka:集群成员管理,controller节点选举
3、Zookeeper应用场景
典型应用场景:
- 配置管理(configuration management)
- DNS服务
- 组成员管理(group membership)
- 各种分布式锁
Zookeeper适用于存储和协同相关的关键数据,不适合用于大数据量存储。
4、Zookeeper服务的使用
应用通过Zookeeper客户端库使用Zookeeper服务。
Zookeeper客户端负责和Zookeeper集群的交互
5、Zookeeper数据模型
Zookeeper的数据模型是层次模型(Google Chubby 也是这么做的)。层次模型常见于文件系统。层次模型和key-value模型是两种主流的数据模型。Zookeeper使用文件系统模型主要基于以下两点考虑:
- 文件系统的树形结构便于表达数据之间的层次关系。
- 文件系统的树形结构便于为不同的应用分配独立的命名空间(namespace)
Zookeeper的层次模型称作data tree。data tree的每个节点叫做znode.不同于文件系统,每个节点都可以保存数据。每个节点都有一个版本(version)。版本从0开始计数 。
6、Data tree 实例
如图所示的data tree中有两棵子树,一个用于应用1(/app1)和另一个用于应用2(/app2)。
应用1的子树实现了一个简单的组成员协议:每个客户端进程pi创建一个znode p_i在/app1下,只要/app1/p_i存在就代表进程pi在正常运行。
7、data tree 接口
Zookeeper对外提供一个用来访问data tree的简化文件系统 API:
- 使用 UNIX风格的路径名来定位znode,例如/A/X 表示znode A 的子节点X。
- znode的数据只支持全量写入和读取,没有像通用文件系统那样支持部分写入和读取。
- data tree的所有 API都是wait-free的,正在执行的API调用不会影响其他 API的完成。
- data tree 的API都是对文件系统的wait-free操作,不直接提供锁这样的分布式协同机制。但是data tree的API非常强大,可以用来实现多种分布式协同机制。
8、znode分类
一个znode可以是持久性的,也可以是临时性的:
- 持久性的znode(PERSISTENT):Zookeeper宕机,或者client宕机,这个znode一旦创建就不会丢失。
- 临时的znode(EPHEMERAL):Zookeeper宕机了,或者client在指定的timeout时间内没有连接server,都会被认为丢失。
znode节点也可以是顺序性的。每一个顺序性的znode关联一个唯一的单调递增整数。这个单调递增整数是znode名字后缀(也有可能是纯数字的子节点, 如 create -s /test/ msg 。 /test/ 目录下面的是顺序递增的纯数字节点。即名字有可能安全是数字)。
如果上面的两种znode具备顺序性,那么又有以下两种znode:
3. 持久顺序性的znode(PERSISTENT_SEQUENTIAL):znode除了具备持久性znode的特点外,znode的名字具备顺序性。
4. 临时顺序性的znode(EPHEMERAL_SEQUENTIAL):znode除了具备临时性znode的特点之外,znode的名字具备顺序性。
Zookeeper主要有以上四种znode。