HBase集群搭建在内网,现在需要从外网访问HBase,对数据进行读写。
首先,需要明白HBase客户端连接HBase集群进行数据读写的流程
1.写流程
1.Client先访问zookeeper,从Region中获取表信息;
2.根据namespace、表名和rowkey根据meta表的数据找到写入数据对应的RegionServerID;
3.通过RegionServerID定位到region;
4.写入数据到Region的Memstore,直到达到一定的阀值(128MB),MemStore中的数据被溢写Flush成一个StoreFile,(与此同时写入相同数据到log预写日志中);
5.随着StoreFile文件的不断增多,当其数量增长到一定阈值后,触发Compact合并操作,将多个StoreFile合并成一个StoreFile,StoreFile底层是HFile,同时进行版本合并和数据删除;
6.单个StoreFile超过一定阀值后,出发Split操作,把当前的RegionSplit分为两个新的Region,父Region此时就会下线,新Split出的2个子Region会被HMaster分配到相应的RegionServer上,使得原先1个Region的压力得以分流到2个Region上。
2.读流程
1.Client发送请求并访问zookeeper,获取meta表信息;
2.通过meta表中的Rowkey,tableName,TimeStamp定位到RegionID;
3.通过这个RegionID查找到相对应的RegionServer
4.查找到RegionServer中,先查找MemStore(写缓存),如果查不到,再进入BlockCache(读缓存)中查询,如果查不到,再进入StoreFile中查(依据StoreFile的索引查),并把结果放在BlockCache中。
所以,HBase客户端进行数据读写不会接触到HMaster,只会接触到zookeeper集群和和所有的regionserver节点。
3.修改HBase的RegionServer端口
HBase默认的RegionServer端口是16020,现在有多个RegionServer,需要为不同的RegionServer配置不同的端口
在Slave1节点上,hbase-site.xml文件添加配置如下
</property>
<property>
<name>hbase.regionserver.port</name>
<value>16020</value>
</property>
在Slave2节点上,hbase-site.xml文件添加配置如下
</property>
<property>
<name>hbase.regionserver.port</name>
<value>16021</value>
</property>
在Slave3节点上,hbase-site.xml文件添加配置如下
</property>
<property>
<name>hbase.regionserver.port</name>
<value>16022</value>
</property>
4.修改客户端/etc/hosts
HBase客户端通过zookeeper获取到regionserver的节点名和端口,例如slave1:16020,slave2:16021,slave3:16022,会解析本机的/etc/hosts文件,获取slave1,slave2,slave3的IP地址,所以,在/etc/hosts添加如下配置
59.69.101.206 slave1
59.69.101.206 slave2
59.69.101.206 slave3
这样,HBase客户端就能知道regionserver的IP和端口了,就能获取和写入数据了。
5.配置路由器
最后,还需要配置路由器,给zookeeper和regionserver节点配置端口映射。
这里的端口映射配置是
59.69.101.206:42181 zookeeper1.ip:2181
59.69.101.206:42182 zookeeper2.ip:2181
59.69.101.206:42183 zookeeper3.ip:2181
59.69.101.206:16020 slave1.ip:16020
59.69.101.206:16021 slave2.ip:16021
59.69.101.206:16022 slave3.ip:16022
5.客户端的hbase-site.xml配置如下
<property>
<name>hbase.zookeeper.quorum</name>
<value>59.69.101.206:42181,59.69.101.206:42182,59.69.101.206:42183</value>
</property>