基于大数据处理技术Hadoop的论坛日志分析_谢树铭.caj
1.2.2.3 HBase
框架Hadoop Database(HBase)
,是模仿谷歌的 Big Table 的一个实现,现在是
Apache基金会下一个开源的子项目,在 Hadoop
的生态圈中充当数据库的角色,但不是传统
的关系型数据库,而是
No Sql(not only sql)非关系型的数据库,是一个以列为主、
可扩展性强、性能高、可靠性高的分布式数据库。
HBase 允许开发人员在 Hadoop 集群上搭建大规模的结构化的分布式存储系统集群。正如传统的关系型数据库使用本地
文件系统存放数据库文件一样,
HBase 使用 Hadoop 集群的 【HDFS 文件系统作为其存储媒介】,而对数据的各种操作语句,使用
HBase 自带的一套操作数据的语句,这套语句【类似 SQL 语句】,是对
【Map Reduce 任务的封装】,也就是说语句的执行会转化成
Map Reduce 任务分发到集群各个节点并发地执行,效率得到了迅速地提升。为了保证
数据操作的协调,HBase 使用 【Zoo Keeper】 进行协调工作的管理。
//
Paste_Image.png
//
Paste_Image.png
Paste_Image.png