hadoop(15)--Hbase入门(表存储机制以及寻址机制)

Hbase是一个以HDFS为数据存储的数据库,为了方便的随机,实时的插入查询才引入的Hbase,这个类似与google的BigTable,Hbase可以存储几十亿行,几百万列的表数据。当然是集群模式下的
Hbase特点:
1,创建表的时候不指定列,只指定若干个列族
2,插入数据是,列族中存储多个列(K-V)
3,一个Value可以有过个,这个是通过版本号来区分的
4,唯一确定一个字段的值,表名--行键--列族--列名(cell)--版本

Hbase的表存储机制

表存储机制

说明

1,一个表的多行可以被分为一个region
2,一个Hregion中包含多个Hstore
3,一个Hstore中包含多个StoreFile
4,一个Hstore中包含一个HFile
5,一个region都分布在regionserver上,统一有Hmaster来调度
6,region最终对应到HDFS中的HFile

思考:数据都被分布式的以HFile的方式存储到了HDFS上面,那么查询的时候Hbase是怎么查找的呢?这就涉及到了Hbase的寻址机制,画图说明一下:

Hbase的寻址机制

寻址机制

说明

1,Table使我们自己的数据表,Mate和root是系统表,表的存储都在是由Hregion来保存的,最终运行在regionServer上面
2,当client访问数据的时候,首先会访问zookeeper,找到HMaster和Root之后,就是找对应的regionServer上的region来读取响应的数据,并且客户端以及Hmaster都会将数据缓存起来

望指正,不吝赐教!

由于最近的事情比较多,与上次分享已有10几天的间期,在这里给关注我的朋友说声抱歉,大数据更新调整为一周两次,等忙过这段时间,大概一个月的时间,大数据更新会正常

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 最近在逐步跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hb...
    飞鸿无痕阅读 50,335评论 19 272
  • 1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能...
    奉先阅读 3,778评论 1 36
  • 该文档是用Hbase默认配置文件生成的,文件源是Hbase-default.xml hbase.rootdir 这...
    我是嘻哈大哥阅读 4,802评论 0 7
  • HBase那些事 @(大数据工程学院)[HBase, Hadoop, 优化, HadoopChen, hbase]...
    分痴阅读 3,985评论 3 17
  • 这时李瑞阳也走了进来,jake说他有工作要处理,让他们先聊,邱然觉得这个老外是越来越懂得中国的人情世故了。 李瑞阳...
    赢月照星空阅读 334评论 0 2