HBase存储机制

2.1Hadoop的限制

Hadoop只能执行批量处理,并且只能以顺序的方式访问数据，导致随机访问的效率较低。

HBase可以存储海量数据，并且以随机方式访问数据。

HBase是一个分布式的面向列的数据库，在表中由行进行排序。在创建表的时候就指定列族，定义列的时候以列族：列名键值对的形式定义。一个表有多个列族，每个列族可以有任意数量的列。后续列的值连续地存储在磁盘上。表中的每个单元格即每个列都有具体的时间戳。

在HBase中：

l 表是行的集合

l 行是列族的集合

l 列族是列的集合

l 列是键值对的结合

下面是表模式的例子

image.png

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

赞1赞

赞赏

手机看全文