集群规划
在Hadoop01 Hadoop02,Hadoop03三台机器上部署zookeeper,hadoop01,hadoop02,hadoop03机器的由来可以参考Hadoop分布式安装一文中的Linux环境准备的步骤
解压安装
- 将准备好的zookeeper的安装包上传到hadoop01中/opt/software中
- 解压文件到/opt/module
tar -zxvf zookeeper-3.4.10.tar.gz -C /opt/module/
配置服务器编号
- 在/opt/module/zookeeper-3.4.10/这个目录下创建zkData
mkdir -p zkData
- 在/opt/module/zookeeper-3.4.10/zkData目录下创建一个myid的文件
vim myid #在文件中添加与server对应的编号:2,直接写2即可
拷贝配置好的zookeeper到其他机器上
xsync zookeeper-3.4.10/
分别在hadoop02、hadoop03上修改myid文件中内容为3、4
配置zoo.cfg文件
- 重命名/opt/module/zookeeper-3.4.10/conf这个目录下的zoo_sample.cfg为zoo.cfg
mv zoo_sample.cfg zoo.cfg
- 修改zoo.cfg文件
- 修改数据存储路径配置dataDir=/opt/module/zookeeper-3.4.10/zkData
- 增加如下配置
#######################cluster##########################
server.2=hadoop102:2888:3888
server.3=hadoop103:2888:3888
server.4=hadoop104:2888:3888
- 同步zoo.cfg配置文件
xsync zoo.cfg
- 关于zoo.cfg中cluster的配置解读
server.A=B:C:D
- A是一个数字,表示这个是第几号服务器;
集群模式下配置一个文件myid,这个文件在dataDir目录下,这个文件里面有一个数据就是A的值,Zookeeper启动时读取此文件,拿到里面的数据与zoo.cfg里面的配置信息比较从而判断到底是哪个server。 - B是这个服务器的地址;
- C是这个服务器Follower与集群中的Leader服务器交换信息的端口;
- D是万一集群中的Leader服务器挂了,需要一个端口来重新进行选举,选出一个新的Leader,而这个端口就是用来执行选举时服务器相互通信的端口。
分别启动Zookeeper
- 在hadoop01 hadoop02 hadoop03上分别执行
bin/zkServer.sh start
- 查看状态
bin/zkServer.sh status