Hbase

一、介绍
1、hbase是面向列的数据库,构建在hadoop之上
2、类似于google的bigtable,对海量结构化数据的快速随机访问
3、是hadoop生态系统的一部分,提供实时随机读写

二、hbase与hadoop的区别
hdfs:
1、分布式文件系统,存储大量数据
2、不支持快速单个记录查找
3、提供了高延迟批处理
4、只提供数据按序访问

hbase:
1、数据库,构建在hdfs之上
2、支持大表的快速查找
3、提供了单行记录低延迟的随机访问(10亿级别)
4、内部使用hash表提供的随机访问,在hdfs上存放索引文件,用于快速查找

三、hbase存储机制
1、面向列族的数据库,适用于海量数据的随机读写
2、table中之定义了列族,表按照row存储
3、术语
table : 表,是row的集合
row : 行,是列族的集合
column famil : 列族,是列的集合
colum : 列,是kv对集合
4、面向行和面向列的区别
row
a、适合OLTP
b、针对行列较少的
column
a、适合于OLAP
b、大表

四、hbase和RDBMS的区别
hbase
1、是无模式的,没有列的定义,之定义列族,列是key
2、适合于宽表,水平可伸缩
3、没有事物支持
4、不是规范化的
5、数据是结构化和半结构化的
rdbms
1、有模式的,描述整个table结构
2、适合于小表,难以扩展
3、事物性的
4、规范化的
5、结构化的

五、hbase架构
1、master---slave 主从结构
2、table从竖直方向进行切割,分成若干个区域,由每个regionserver进行处理
3、master server(ms)
a、负责指派region给rs,通过ak获得task的帮助
b、处理跨rs的region的负载均衡问题
c、从 繁忙服务器到空闲服务器之间的数据转载
d、通过裁定负载均衡判断集群的状态
4、region
被切割的表,跨rs
5、region server(rs)
a、和client通信
b、处理数据操作
c、处理他下面的所有的region的读写请求
d、通过阈值决定size

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近在逐步跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hb...
    飞鸿无痕阅读 50,338评论 19 272
  • HBase那些事 @(大数据工程学院)[HBase, Hadoop, 优化, HadoopChen, hbase]...
    分痴阅读 3,994评论 3 17
  • HBase存储架构图 HBase Master 为Region server分配region 负责Region s...
    kimibob阅读 5,627评论 0 52
  • 一、HBase简介 Hbase是什么 HBase是一种构建在HDFS之上的分布式、面向列、多版本、非关系型的数据库...
    便利蜂数据平台阅读 987评论 0 4
  • 该文档是用Hbase默认配置文件生成的,文件源是Hbase-default.xml hbase.rootdir 这...
    我是嘻哈大哥阅读 4,811评论 0 7