Hbase是分布式,可伸缩,面向列,高容错,快速查询写入的海量数据存储系统。
1.client
提供访问Hbase的接口和维护cache加速对Hbase的访问
2.zookeeper
Hmaster和region启动时,会在zookeeper中注册,Hbase依赖于zookeeper。
zookeeper作用
- 保证hbase只有一个master
- 保存region的地址入口信息
- 监控regionserver的上下线 ,通知master处理
- 记录hbase的schema和table元数据信息
3.Hmaster
为regionserver分配region数据;
负责regionserver负载均衡;
4.regionserver
维护Hmaster分配的region数据;
处理region的io请求;
处理region过大之后的切分操作;
5.region
相当于表的一段数据;
分布式存储和负载均衡的最小单元;
6.store
一个columnfamily就是一个store;
一个region下面可能有几个store;
7.storefile
memstore内存的内容最后存到storefile里面,storefile以hfile格式保存;
8.Hlog
hlog是记录数据所有变更的记录,用于数据恢复;