按照总体计划,这次来看看Master的启动以及运行过程,hbase的版本还是1.0.0。
首先通常hbase集群中会有两种HMaster,一个active master,以及多个backup master,分别通过hbase-daemon.sh start master以及hbase-daemon.sh start master --backup启动。关于shell脚本的分析可以参考以前写的regionserver的启动过程(http://www.jianshu.com/p/20d79c4170ec),这里就不详细讲了。
一、创建HMaster的准备工作
无论是active还是standby,最后都是通过执行org.apache.hadoop.hbase.master.HMaster的主函数来启动master的。
关于HBase中进程的启动,代码做了很多包装,上次regionserver没有详细讲,放到这里的HMaster来讲,下面是相关类的类图。
HMaster中main函数调用的doMain方法是在ServerCommandLine中实现的,这个类主要读取了hbase的一些配置文件,并且启动对应的进程,相关代码如下所示:
Tool接口中的run方法则是在HMasterCommandLine中实现的,这里会判断是否启动backup master,修改相关配置;然后再根据传入的参数确定是start还是stop,还有一个clear貌似跟zookeeper相关,还不是很懂,以后再看。
在startMaster方法中,会根据配置判断是本地模式还是分布式,前者不常用就不说了,后者则会动过HMaster的constructMaster方法、利用反射机制,获取构造函数,然后再创建HMaster实例。
二、HMaster的构造方法
如同第一部分的UML类图所示,在HBase1.0.0版本中,HMaster继承自HRegionServer,而且两者RPC服务坚挺的端口都是由hbase.regionserver.port参数指定,所以不能像以前那样可以在同一台主机上启动HMaster以及HRegionServer两个服务了。
但是由于两个RPC类监听的协议不同(MasterRpcServices通过重写getServices方法实现),所以两者处理不同的RPC请求。下面分别是RSRpcServices中构造RPC服务的代码、RSRpcServices中getServices方法的代码以及MasterRpcServices中getServices的方法代码。
这里有一点搞不懂,HMaster又不负责处理RegionServer的服务,为什么RPC还要包括RegionServer的两个RPC协议,看以后会不会弄清楚点吧。
除了RPC服务之外,还可以根据配置,看是否需要将集群状态实时发送给客户端。
最后实例化了activeMasterManager,对象用于master之间选举active的选举并且让backup master循环等待成为active的master。
三、ActiveMaster的后续初始化
当active master确认前面两个步骤执行完成之后,还需要进行一系列的其他初始化工作,集中在finishActiveMasterInitialization方法中。
在该方法中,首先开启一个线程zombieDetector,确保active HMaster的初始化工作需要在“hbase.master.initializationmonitor.timeout”配置内完成,否则初始化失败。
总体初始化的过程比较简单,主要包括以下过程:
1.启动一些该启动的线程例如平衡线程、集群状态监控线程等等;
2.等待hbase.master.wait.on.regionservers.mintostart个regionserver启动;
3.分配hbase:meta这张表的region,在老的版本里面,定位服务涉及到root以及meta两张表;但是新版本(从0.96开始)里面已经没有root表了,hbase:meta表也只有一个region不能split。虽然没有root表会影响集群整体容量,但是大多数情况下只要hbase:meta表也就够了,实在不行可以把region调整大一些。
最后推荐一篇文章http://www.blogjava.net/DLevin/archive/2015/08/22/426877.html,这个主要是讲的hbase的体系结构,也涉及到了比较新的版本,大家可以看看。