HBase存储机制

2.1Hadoop的限制

Hadoop只能执行批量处理,并且只能以顺序的方式访问数据,导致随机访问的效率较低。

2.2HBase的存储机制

HBase可以存储海量数据,并且以随机方式访问数据。

HBase是一个分布式的面向列的数据库,在表中由行进行排序。在创建表的时候就指定列族,定义列的时候以列族:列名键值对的形式定义。一个表有多个列族,每个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格即每个列都有具体的时间戳。

在HBase中:

l 表是行的集合

l 行是列族的集合

l 列族是列的集合

l 列是键值对的结合

下面是表模式的例子

image.png
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Zookeeper用于集群主备切换。 YARN让集群具备更好的扩展性。 Spark没有存储能力。 Spark的Ma...
    Yobhel阅读 12,062评论 0 34
  • 一、简介 Hbase:全名Hadoop DataBase,是一种开源的,可伸缩的,严格一致性(并非最终一致性)的分...
    菜鸟小玄阅读 7,102评论 0 12
  • 原创文章,转载请注明原作地址:http://www.jianshu.com/p/0f9578df7fbc 一. 架...
    EchoZhan阅读 15,217评论 4 33
  • 一、HBASE概述 (1)概述 基于hadoop的数据库工具 来源于google的一片论文BigTable 后来由...
    truezqx阅读 3,325评论 0 4
  • 看着这数字在倒数,也再告诉我时间不多了,珍惜专注。 明明熟悉的地方和人,但写着写着总感觉都是相像的,可能写着写着变...
    符梅算阅读 903评论 0 0