登录注册写文章

IV、HBase-读写流程

一种依耐丶从未离开

IV、HBase-读写流程

HBase读数据流程

Hbase的regionserver的内存Memstore，block cache。Memstore作业主要是写，另一部分主要是读的。block cache用的是LRU，如果block cache达到上限，会启动淘汰机制。

HRegionServer保存着.META.的这样一张表以及表数据，要访问表数据，首先Client先去访问zookeeper，从zookeeper里面找到.META.表所在的位置信息，即找到这个.META.表在哪个HRegionServer上保存着。
接着Client通过刚才获取到的HRegionServer的IP来访问.META.表所在的HRegionServer，从而读取到.META.，进而获取到.META.表中存放的元数据。
Client通过元数据中存储的信息，访问对应的HRegionServer，然后扫描(scan)所在
HRegionServer的Memstore如果没有，扫描block cache（读数据的缓存），如果还没有去Storefile来查询数据，查到数据之后将数据读到block cache。
最后HRegionServer把查询到的数据响应给Client。

HBase写数据流程

Client也是先访问zookeeper，进而找到.META.表，并获取.META.表信息。
确定当前将要写入的数据所对应的RegionServer服务器和Region。
Client向该RegionServer服务器发起写入数据请求，然后RegionServer收到请求并响应。
Client先把数据写入到HLog，以防止数据丢失。
然后将数据写入到Memstore。
如果Hlog和Memstore均写入成功，则这条数据写入成功。在此过程中，如果Memstore达到阈值，会把Memstore中的数据flush到StoreFile中。
当Storefile越来越多，会触发Compact合并操作，把过多的Storefile合并成一个大的Storefile。当Storefile越来越大，Region也会越来越大，达到阈值后，会触发Split操作，将Region一分为二。

尖叫提示：因为内存空间是有限的，所以说溢写过程必定伴随着大量的小文件产生。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Hbase
参考：https://www.jianshu.com/p/569106a3008f 最近在逐步跟进Hbase的相关...
博弈史密斯阅读 4,306评论 1赞 1
HBase基础（一）：架构和组件
1、基本概念 HBase是一个开源的非关系型分布式数据库（NoSQL），参考了谷歌的BIgTable建模，实现的编...
雪飘千里阅读 4,610评论 0赞 2

Hbase
HBase存储架构图 HBase Master 为Region server分配region 负责Region s...
kimibob阅读 10,928评论 0赞 52
Hbase原理分享
一、HBase简介 Hbase是什么 HBase是一种构建在HDFS之上的分布式、面向列、多版本、非关系型的数据库...
便利蜂数据平台阅读 4,513评论 0赞 4
有一种难过……
有一种难过是笑着说我都好，你放心，然后转身擦掉那不知道何时滑落的泪。有一种忧伤是偷偷装在兜里的糖，偶尔摸摸，一直...
随心而动自由呼吸阅读 1,579评论 0赞 7

赞1赞

赞赏

手机看全文