Hbase架构师3-Hbase源码分析

HBase的源码:

1、集群启动
master启动
regionsever启动
2、put 插入数据源码分析
delete
3、get 查询数据源码分析
scan
4、三个重要的行为:
flush
split
compact
5、寻路
根据rowkey定位region的位置

注意要点:

1、版本问题:
hbase-0.96 hbase-0.98
hbase-1.2.x hbase-1.4.x
hbase-2.x 这是我们选择的版本

2、版本越低,其他非核心流程的代码相对更少,对你的干扰更少

3、切记最好画图!

4、关于hbase的源码是否要编译呢。
选择性的。如果要编译:推荐安装 cygwin
zookeeper
hive
hdfs
kafka
hbase

HBase2.x源码分析-HMaster启动流程分析

正常的启动历程:

启动一个 master
再启动 N 个 regionserver
启动一个 master
在这个过程中,会有选举!大概率:先启动的master会成为 active

HBase集群启动的命令:start-hbase.sh
这个命令的底层是:
hbase-daemon.sh start master
这个命令的底层:
java org.apache.hadoop.hbase.master.HMaster arg1 arg2
底层转到
HMaster.main()

class HMaster extends HRegionServer implements MasterServices
1、HMaster 是 HRegionServer 的子类
2、HMaster 绝大部分的服务,都是通过 MasterServices 来实现的

比如:listTable()  craeteTable()

↓ ***▲ ▼ ——》

HMaster正常的启动历程: 0;25:00 ~ 2:00:00
HMaster.main() 
               ▼ 
            new HMasterCommandLine(HMaster.class).doMain(args);
         ——》 父类 ServerCommandLine#doMain
                ▼
            int ret = ToolRunner.run(HBaseConfiguration.create() 
             ↓  
          HMasterCommandLine#run()
               ▼
         return startMaster();
          ......
         return stopMaster();
                 ▲
          ——0  》上面   startMaster()  方法 启动服务器
                        ▼
                  /********                 
                 *   注释: 通过反射构造 HMaster 实例, HMaster 是 HRegionServer 的子类,
                 *   1、先看 HMaster 中的构造方法做了什么
                 *   2、再进入 Hmaster 的 run() 方法看看做了什么
                 *   3、masterClass = HMaster.class
                 */
                  if(LocalHBaseCluster.isLocal(conf)) {
                    // local模式
                   ......    
                 } else {
                       // 集群模式
                   ......    
                       HMaster master = HMaster.constructMaster(masterClass, conf);
                    ......  
                   /******** 
                 *   1、hmaster 通过 start() 启动
                 *   2、hmaster 肯定也是一个线程
                 *   3、当执行 start 方法之后,应该转到 hmaster 的 run() 继续阅读
                 */ 
                        master.start();
                        master.join();                       
                  }
                      ▲ 
             ——0. 1  》上面  HMaster#constructMaster 方法是调用  HMaster(final Configuration conf) 构造函数                               
                     ——0. 1.1 》super(conf); // HMaster父类 HRegionServer#构造器里面的方法
                               ▼
                             /********        
                              *   1、创建 RPCServer
                              *   2、最重要的操作:初始化一个 ZKWatcher 类型的 zookeeper 实例,
                              *        用来初始化创建一些 znode 节点
                              *   3、启动 RPCServer
                              *   4、创建 ActiveMasterManager  用来选举和管理hmaster的状态
                              *   hmaster除了调用自己的构造方法,也会调用 父类hregionserver的构造方法
                              */
                           rpcServices = createRpcServices();
                          RpcRetryingCallerFactory.instantiate(this.conf);
                         regionServerAccounting = new RegionServerAccounting(conf);
                          initializeFileSystem();
                         zooKeeper = new ZKWatcher()   
                            this.rpcServices.start(zooKeeper);
                               //ChoreService 里面包装了一个线程池,用来处理 hmaster 或者 hre
                            this.choreService = new ChoreService(getName(), true);
                             // ExecutorService 同样也是包装了一个线程池,用来处理其他的 RpcClient 发送过来的请求
                              this.executorService = new ExecutorService(getName());
                             //  启动 jetty,Region Server WebUI
                            putUpWebUI();
                                 ▲ 
                          ——》上面的   new ZKWatcher()   #构造函数
                                          ▼
                                     /**** 
                                      *   注释: 初始化一堆关于 hbase 在 zookeeper 创建的 znode 节点          
                                       *   hbae装好了之后u,默认在zookeeper有一个/hbase 的root znode
                                       *   zookeeper.znode.rs = /hbase/rs
                                      *   zookeeper.znode.draining.rs = /hbase/draining
                                      *   zookeeper.znode.backup.masters = /hbase/backup-masters
                                      *  /
                                     this.znodePaths = new ZNodePaths(conf);
                                    .......
                                       /* 注释: 获取 zk 链接
                                          *   recoverableZooKeeper 这个实例里面有一个 ZooKeeper zk 的成员变量
                                         *   HMaster HRegionserver 都是通过 recoverableZooKeeper 的 
                                        *  zk 实例来完成操作 zookeeper
                                        * /
                                 this.recoverableZooKeeper = ZKUtil.connect(conf, quorum, pendingWatcher, identifier);
                                  ......
                                /****
                                  *   注释: 创建一堆必要的父节点
                                  *   1、baseZNode = /hbase
                                  *   2、rsZNode = /hbase/rs
                                  *   .............
                                  */
                                   createBaseZNodes();
              
                      —— 0.1.2 》 HMaster 自己构造器里面的代码
                               /*** 
                                 *   注释: 创建 activeMasterManager
                                 *   帮助 HMaster 去选举  Active 角色
                                *   监控 HMaster的状态,也要去监控 zookeper 集群中的对应的  active master 的znode
                                 */ 
                               if(!conf.getBoolean("hbase.testing.nocluster", false)) {
                                  this.activeMasterManager = 
                                     new ActiveMasterManager(zooKeeper, this.serverName, this);
                                } else {
                                        this.activeMasterManager = null;
                               }
        —— 0. 2 》 回到 上面 0处  master.start(); 方法,即运行HMaster 的run()方法
                               ▼                          
                        /*
                         *   注释: 启动 Web 服务
                         */
                        int infoPort = putUpJettyServer();

                        /*
                         *   注释:重要的方法
                         */
                        startActiveMasterManager(infoPort);
                             ▼
              /* 
                *   注释: 一上线,就通过 MasterAddressTracker.setMasterAddress() 方法创建代表自己存在与否的 backup znode emphamaral 节点
              *   一上线,都不是 active master,所以先成为 backup master,然后创建代表自己的临时 znode 节点
               *   1、如果时机条件正确,则成为 active master,则刚才创建的 临时znode 节点被 ActiveMasterManager 显示删除
               *   2、如果不能成为 active master 不需要做什么
                *   3、如果这个 backup master宕机,则 zookeeper 会自动删除这个临时节点
                 */
                 String backupZNode = 
                 ZNodePaths.joinZNode(zooKeeper.getZNodePaths().backupMasterAddressesZNode, 
                serverName.toString());
               //  :ZNodePaths.joinZNode 唯一的目的只有一个:拼接一个znode路径:
              //   当前master一启动就立即在 /hbsae/backup-masters/ 下面创建一个临时节点
             //   代表自己上线了。但是并没有立即成为  active  
             
               //  这儿是去创建 Backup Master ZNode
              if(!MasterAddressTracker.setMasterAddress(zooKeeper, backupZNode, serverName, infoPort)) {
               。。。。。。
               /* 重点!!: 阻塞到直到有 ActiveMaster 为止, 但是默认是 False,不会执行,
                  *   除非有人显示调整这个参数为 True
                   *   因为可能同时有多个 amster 启动。
                    *   等待是否有 activeMaster
                   */      
             if(conf.getBoolean(HConstants.MASTER_TYPE_BACKUP, 
                  HConstants.DEFAULT_MASTER_TYPE_BACKUP)) { 
                               while(!activeMasterManager.hasActiveMaster()) {                
                                 Threads.sleep(timeout);  
                  }
                }
              /* 注释: if 中的方法,完成注册和争抢成为 Active Master 的工作
             */
               @@@   if (  activeMasterManager.blockUntilBecomingActiveMaster(timeout, status)) {
                         ——》 ActiveMasterManager#blockUntilBecomingActiveMaster
                                         ▼
                 /** 去注册 Active Master, 记住:也是临时节点
                  *   分布式锁的方式来实现的!
                 *   MasterAddressTracker.setMasterAddress() 创建一个 临时 znode 节点,
                 *   多个 hmsater 如果同时启动,则可能同时都在创建这个 代表 active 身份的 znode 节点
                 *   谁创建成功了,谁才能成为 active
                 *  所以:如下的代码,如果能进入到 if ,就证明当前 hmaster 争抢这把分布式锁成功了。
                 *  当前 hmaster 才能成为 active                 *
                 *  接着再做一件事:就是删除之前一上线 就创建的 backup znode 节点
                 */
                if(MasterAddressTracker.setMasterAddress(this.watcher,  // 抢锁

                    /* 如果注册成功,则删除自己原先创建的 backup master znode 临时节点
                     */                    
                    if(ZKUtil.checkExists(this.watcher, backupZNode) != -1) {
                        LOG.info("Deleting ZNode for " + backupZNode + " from backup master directory");
                        ZKUtil.deleteNodeFailSilent(this.watcher, backupZNode);
                    }

                    /*  将znode保存在文件中,这将允许检查启动脚本是否崩溃
                     */                   
                    ZNodeClearer.writeMyEphemeralNodeOnDisk(this.sn.toString());
                    /*  设置 Master 为 Active 状态
                     */                  
                    startupStatus.setStatus("Successfully registered as active master.");
                    /* : 到上面为止,也只是知道有 Active Master了,但是到底是谁不知道
                 *   所以通过获取 Active Master ZNode节点的数据得知
                 */
                String msg;
                byte[] bytes = ZKUtil.getDataAndWatch(this.watcher, 
                                         this.watcher.getZNodePaths().masterAddressZNode);
                if(bytes == null) {
                    msg = ("A master was detected, but went down before its address " 
                                  + "could be read.  Attempting to become the next active master");
                } 
                                       ▲ 
                       ——》 回到@@@   if (  activeMasterManager.blockUntilBecomingActiveMaster处
                              // 下面这个方法非常复杂重要
                              finishActiveMasterInitialization(status);         
                                             ▼
                              /*  初始化 ProcedureExecutor
                                 *   将来你的各种请求,比如 createTable, listTable, put, get 等等这些用户请求,
                                 *    都是被封装成一个个的
                                 *   Procedure 来执行的。 放在线程池里面执行。
                               *   ProcedureExecutor 命令执行器!!!
                               */
                               createProcedureExecutor();
                             /*  初始化 AssignmentManager 用来帮助 HMaster 去分配那些 region
                                  给那些 regionsever 去管理
                                *   默认的实现就是:AssignmentManager
                                */
                                   this.assignmentManager = createAssignmentManager(this);


![image.png](https://upload-images.jianshu.io/upload_images/11332520-735619ee163723d5.png?imageMogr2/auto-orient/strip%7CimageView2/2/w/1240)
2 RegionServer正常的启动历程: 2;00:00 ~ 2;12:00

HBase集群启动的命令:start-hbase.sh
这个命令的底层是:
hbase-daemon.sh start regionserver
这个命令的底层:
java org.apache.hadoop.hbase.regionserver.HRegionServer arg1 arg2
底层转到
HMaster.main()

class HRegionServer extends HasThread implements RegionServerServices
1、HMaster 是 HRegionServer 的子类, HRegionServer 是 HasThread 的子类
HasThread 是 RUnnable 的子类,所以 HMaster 和 HRegionServer 都是线程
入口:main() run() 方法

HRegionServer.main()
    HRegionServer 的构造方法
    HRegionServer 的 run()
        preRegistrationInitialization();
            initializeZooKeeper();
            setupClusterConnection();
            this.rpcClient = RpcClientFactory.createClient()
        reportForDuty();
            masterServerName = createRegionServerStatusStub(true);
            this.rssStub.regionServerStartup(null, request.build());
        handleReportForDutyResponse(w);
            createMyEphemeralNode();
            initializeFileSystem();
            ZNodeClearer.writeMyEphemeralNodeOnDisk(getMyEphemeralNodePath());
            setupWALAndReplication();
            startServices();
            startReplicationService();
        tryRegionServerReport(lastMsg, now);
            rss.regionServerReport(null, request.build());
3 Put流程源码分析: 2;21:00 ~

核心流程:

代码入口:
table.put(new Put())

大致流程:
1、首先客户端会请请求zookeepre拿到meta表的位置信息,这个meta表的region到底在那个regionserver1里面
2、发请求请求这个regionserver1扫描这个meta表的数据,确定我要插入的数据rowkey到底在那个用户表的region里面。并且还拿到这个region在那个regioinserver2的信息
3、发送请求,请求regionserver2扫描 当前用户表的regioin, 执行插入
1、先记录日志
2、写入数据到 memstore
写到 ConcurrentSkipListMap delegatee
3、判断是否需要进行flush
1、再次判断是否需要进行 compact
2、判断是否需要进行 split

——》开始 HTable#put()

/* callable = ClientServiceCallable, 是 RegionServerCallable 的子类。
* 最终执行:ClientServiceCallable.doMutate(request); 提交
* 将来各种兜兜转转,一定会回到调用: callable.rpcCall()
/
ClientServiceCallable<Void> callable = new ClientServiceCallable<Void>(this.connection, getName(), put.getRow(),
this.rpcControllerFactory.newController(), put.getPriority()) {
@Override
protected Void \color{#FF3030}{rpcCall}() throws Exception {
/
* 构建一个 Put 请求
* 仅仅只是把 put 变成 request
/
MutateRequest request = RequestConverter.buildMutateRequest(getLocation().getRegionInfo().getRegionName(), put);
// 具体提交执行(使用probubuf协议序列化,并提交RPC请求)
doMutate(request);
▲ ↓
——》 RSRpcServices#Mutate()
/
*

3.1 -Region定位分析 开始 3:00:00
  • connection.locateRegion(){
  • locateMeta(tableName, useCache, replicaId);
    
  • locateRegionInMeta(tableName, row, useCache, retry, replicaId);
    
       *   1、虽然经过层层递进的寻找,发现,返回的对象类型是:BlockingStub
       *   2、最终跳转到 RSRpcServices
       *
       *   现在在探查put方法的底层实现, put方法的服务端响应者是  master regionserver ?
       *   是发送给 RegionServer 的, 是怎么确定到底发送给那个 Regionserver ?
       *
       */
                    ——》 return getStub().mutate(getRpcController(), request);
                                              ↓ 
             ###     RpcRetryingCallerImpl#callWithRetries
                                        ▼   
    
               / *   3、这里面会获取 region 的位置
                   *   callable = ClientServiceCallable, 是 RegionServerCallable 的子类
                    *      笔记中的第一步,第二步就是这句代码实现的
                *  1、首先客户端会请请求zookeepre拿到meta表的位置信息,
                *  这个meta表的region到底在那个regionserver1里面
               *  2、发请求请求这个regionserver1扫描这个meta表的数据,
               *  确定我要插入的数据rowkey到底在那个用户表的region里面。
              *  并且还拿到这个region在那个regioinserver2的信息
               */              
           ——0  》     callable.prepare(tries != 0);
                                               ↓ 
                        RegionServerCallable #prepare     
                                         ▼  
                         /***  这个 row 就是 Callble 在初始化的时候拿到的 rowkey
                              *   该方法负责拿到 rowkey 在该表中的 region 的信息, 封装在 HRegionLocation 对象中
                              *   row = put 对象中的 rowkey
                             *   location = HRegionLocation (RegionServerName HRegionInfo)
                          */
                        this.location = regionLocator.getRegionLocation(row);
                                                              ↓ 
                             ConnectionImplementation#locateRegion()
                                                            ▼  
                                if(tableName.equals(TableName.META_TABLE_NAME)) {
                                      // 如果是 hbase:meta 表,则发请求给 zookeeper              
                                       《1》     return locateMeta(tableName, useCache, replicaId);
                                 } else {
                                       //**  如果是普通表,则发请求给 meta 所在的 regionserver            
                                       《2》    return locateRegionInMeta(tableName, row, useCache, retry, replicaId);
                                }
                              ——1 》 ConnectionImplementation# locateMeta
                                                                ▼   
                                             /***  定位 zookeeper 访问 meta 表所在的位置
                                                *   registry = ZKAsyncRegistry
                                                  */        
                                            locations = get(this.registry.getMetaRegionLocation());
                                                                                        ↓ 
                                                         ZKAsyncRegistry.getMetaRegionLocation() 
                                                                                       ▼  
                                                             //**  从zookeeper中获取 meta 表的位置                    
                                                             getMetaRegionLocation(future, metaReplicaZNodes);
                                                           ——》getMetaRegionLocation
                                                                                        ▼  
                                                            /*** : 由于meta的Region可能有多个副本,因此遍历
                                                              ** /hbase/meta-region-server-i,返回所有副本对应的ServerName
                                                                 *   遍历(i, /hbase/meta-region-server-i)         
                                                                *   因为 hbae-2.x 版本中, meta 表的 regoin 有副本的概念
                                                                    */
                                                               for(String metaReplicaZNode : metaReplicaZNodes) 
                                                                    ......
                                                                   //  注释: getAndConvert() 帮助我们去获取数据 
                                                                     addListener(getAndConvert(path, ZKAsyncRegistry::),
                                                                     
                                                                     ——》getAndConvert()
                                                                                addListener(zk.get(path)
                                                                             ——》zk.get()
                                                                                      ▼  
                                                                               /*  ZKTask 加入 tasks 队列,去寻找  tasks.poll 代码,
                                                                                   *   会看到调用 zkTasks.run() 代码执行,
                                                                                    *   里面执行 doExec(ZooKeeper zk) 方法
                                                                                    */
                                                                                  tasks.add(new ZKTask<byte[]>(path, future, "get") {
                                                                                       @Override
                                                                                    protected void doExec(ZooKeeper zk) {
                                                                                     /**  终于看到 meta region 的位置是从 zk 获取的
                                                                              *   path = /hbase/meta-region-server/  meta表
                                                                              的唯一的region的位置信息
                                                                            */
                                                                            zk.getData(path, false, 
                            ——2 》 ConnectionImplementation# locateMeta 
                                            cacheLocation()
                                         ——》MetaCache.  cacheLocation()
                                                   addToCachedServers(locations);
    
           ——回到 0  处继续 》   callable.prepare(tries != 0);  
                 /** 
               *   1、如果是元数据请求操作:MasterCallble, DDL 操作,走这儿
               *   2、如果是数据请求操作:RegionServerCallable, DML 走这儿
               */
              return callable.call(getTimeout(callTimeout));
                                                  ↓ 
                RegionServerCallable.call()
                               rpccall()
                                        ↓ 
                             HTable#put()
                                               ▼  
                                ClientServiceCallable<Void> callable = new ClientServiceCallable
                                  protected Void rpcCall() throws Exception {
                                         doMutate(request);
                                ——》 ClientServiceCallable#doMutate()
                                                        ▼  
                                         /* 
       *   1、虽然经过层层递进的寻找,发现,返回的对象类型是:BlockingStub
       *   2、最终跳转到 RSRpcServices         *
       *   现在在探查put方法的底层实现, put方法的服务端响应者是  master regionserver ?
       *   是发送给 RegionServer 的, 是怎么确定到底发送给那个 Regionserver ?         *
       */
                                        return getStub().mutate(getRpcController(), request);
                                                                            ↓ 
                                                RSRpcServices#mutate()
                                                                            ▼  
                                          /** : 获取当前 请求的 region 位置
                                           *   获取 region 的方式方法是通过 regoinName 获取 regionInfo 信息
                                            */
                                         region = getRegion(request.getRegion());
                                         /** 如果没有,提交给HRegion.put()方法处理 
                                               *   clientTable.put(put) 
                                               *   regioniserver.put(put)
                                                *   region.put(put)
                                                   */
                                               region.put(put);
    
3.1 -Region定位分析 结束 3:23:00
                                                ——》HRegion.put()
3.2 -写入内存memstore 及Flush分析 Memstore形成HFile 开始 3:23:00
                                                                  ▼ 
                                                  HRegion#checkResources() //检查资源
                                                             ......
                                                   /** 
                                                    *   1、checkResources(); 会涉及到flush, 
                                                   *      进行 put 操作之前检查资源是否足够
                                                    *   2、doBatchMutate(put); 是用来真正完成put操作的。
                                                   *      完成 put 操作之后,也需要判断 memstore 是不是要进行 flush
                                                   */ 
                                              doBatchMutate(put);    
                                            ——  》HRegion#doBatchMutate
                                                 —— ... 》HRegion#batchMutate(BatchOperation<?> batchOp)
                                                            ▼
              // 完成数据插入到 memstore 的动作 
                        3    doMiniBatchMutate(batchOp);
                                                       ......
                            // 写完数据之后,判断是否有需要进行 flush                  
                         4    requestFlushIfNeeded();
                                                     ▲
                   ——接3 》 doMiniBatchMutate(batchOp);
                                                         ▼  
                                                 //六个步骤
                                               /*第一步
                                                  *   对BatchOperation对象上锁,返回的是一个表示
                                                 * 正在处理中的对象 MiniBatchOperationInProgress                                                       
                                                  *   HBase 是有行级的事务的!  
                                                 *     现在执行的各种  Put 的 rowkey 所对应的 这一行数据的 锁我们都得拿到
                                                */ 
                                         miniBatchOp = batchOp.lockRowsAndBuildMiniBatch(acquiredRowLocks);
                                            /*第2步   
                                               *   更新所有操作对象的时间戳,确保是最新的。
                                            *        就只是更新 keyvalue 的时间戳为 本机服务器的时间戳!
                                             */
                                   long now = EnvironmentEdgeManager.currentTime();
                                 batchOp.prepareMiniBatchOperations(miniBatchOp, now, acquiredRowLocks);
                                             /*第3步   
                                               *   初始化或构造 WAL edit对象 
                                             */
                                      List<Pair<NonceKey, WALEdit>> walEdits = 
                                        batchOp.buildWALEdits(miniBatchOp);
                                              /*第4步   
                                               *  将WALEdits对象提交并持久化(即写WAL)
                                             */
                                       mvcc.complete(writeEntry);
                                             /*第5步   
                                               *  写 memStore
                                             */
                                    writeEntry = 
                              5    batchOp.writeMiniBatchOperationsToMemStore(miniBatchOp, writeEntry);
                                             /*第6步   
                                               *  完成写入操作
                                             */
                              6     batchOp.completeMiniBatchOperations(miniBatchOp, writeEntry);
                                                     ▲
                              ——上接  5   》 batchOp.writeMiniBatchOperationsToMemStore
                                                                              ↓                                                          
                                                                HRegion#
                                                                MutationBatchOperation#
                                                                writeMiniBatchOperationsToMemStore()
                                                                           ▼    
                                                               super.writeMiniBatchOperationsToMemStore(
                                                                            ▼  
                                      /* 
                                       *   1、一个region其实按照列簇会分成多个不同的 store
                                        *   2、现在插入数据的时候,可以这一个miniBatch 会包含多个不同的列簇的数据
                                     *   3、不同的列簇,拥有不同的memstore
                                 *   4、到了这个步骤必须把所有的数据,区分开,不同的列簇的,数据,分别进行插入
                              */
                                    applyFamilyMapToMemStore(familyCellMaps[index], memStoreAccounting);                                
                                                                            ▼  
                                //按照列簇循环写入
                              for(Map.Entry<byte[], List<Cell>> e : familyMap.entrySet()) {
                                     region.applyToMemStore(region.getStore(family), cells, 
                                                                         ▼  
                         if(upsert) {
                                       store.upsert(cells, getSmallestReadPoint(), memstoreAccounting);
                                    } else {   //  store 包含  Memstore 和 StoreFile 
                                              store.add(cells, memstoreAccounting);
                                                        ▼  添加到内存
                                                                 memstore.add(cells, memstoreSizing);
                                                              ↓
                                           AbstractMemStore.add
                                                        ▼  循环cell添加
                                           for(Cell cell : cells) { 
                                                add(cell, memstoreSizing);    }
                                                  ——》AbstractMemStore.add
                                                      ——》doAddOrUpsert
                                                        ——》AbstractMemStore#doAdd()
                                                             ——》AbstractMemStore#internalAdd()
                                                                ——》 MutableSegment#add()
                                                                    ——》Segment#internalAdd()
                                                                                   ▼  
                                                                           //终于放进内存
                                                        5.1       boolean succ = getCellSet().add(cell);
                                                                                //更新元数据信息 
                                                                            updateMetaInfo(cell, succ,  
                                                                                   ▲
                                                                  ——上接5.1 》CellSet.add()
                                                                                    ▼  
                                                                     / *   delegatee 是 ConcurrentSkipListMap
                                                                  *   即 memstore的内存结构: 跳表  
                                                            *   基于链表来实现的,
                                                 *  兼顾插入和排序,和查询效率,这是最终的步骤
                                                         */
                                                                          return this.delegatee.put(e, e) == null;
                                                                                                           ▲
                               ——上接  6   完成写入》 batchOp.completeMiniBatchOperations
                                       ——》HRegion.BatchOperation.completeMiniBatchOperations
3.2 -写入内存memstore 及Flush分析 Memstore形成HFile 结束 3:45:00
                         ——上接4 》requestFlushIfNeeded()
                             ——》reqeustFlush()
                             ——》requestFlush0()
                                              ↓
                                      MemStoreFlusher#requestFlush()
                                               ▼
                                  // 加入队列 一定有一个地方是取poll  fqe 来执行 flush                 
                                   this.flushQueue.add(fqe);
                                                  ↓     搜索flushQueue.poll 
                                            MemStoreFlusher#FlushHandler#run()
                                                  ▼ 
                                    //*** 注释: 取出队列执行处理                  
                             fqe = flushQueue.poll(threadWakeFrequency, TimeUnit.MILLISECONDS);
                                           ......
                               //*** 溢写! 
                              if(!flushRegion(fre)) { 
                                ——》flushRegion(HRegion region, boolean emergencyFlush,
                                                                 boolean forceFlushAllStores, FlushLifeCycleTracker tracker) 
                                                                              ▼3件事
                                            1  FlushResult flushResult = region.flushcache(
                                             // 注释:溢写完毕之后,判断是否需要进行 compact 
                                           2  boolean shouldCompact = flushResult.isCompactionNeeded();
                                          // 注释:溢写完毕之后,判断是否需要进行 split
                                           3   boolean shouldSplit = region.checkSplit() != null;
                                         ——1 》 HRegion#flushcache
                                                                         ▼
                                     //   注释: 执行真正的 Flush 方法                
            FlushResultImpl fs = internalFlushcache(specificStoresToFlush, status, 
                                                                                 writeFlushRequestWalMarker, tracker);
                                                    ——》HRegion#internalFlushcache
                                                        ——》HRegion#internalFlushCacheAndCommit
                                                                                            ▼
                                                                       flush.flushCache(status);
                                                                                             ↓ 
                                                                          Hstore#flushCache
                                                                         ▼HStore.this.flushCache
                                                                                ▼ flusher.flushSnapshot
                                                                                                        ↓
                                                                               DefaultStoreFlusher#flushSnapshot   
                                                                                            ▼
                                                     / *   注释: writer = StoreFileWriter
                                                     *   flush 把  跳表中的数据 写到磁盘文件。  需要输出流
                                                     */                                                         
                                                           writer = store.createWriterInTmp(cellsCount,.
                                                                       /* 
                                                                          *   1、scanner 扫描器
                                                                          *   2、writer 输出流
                                                                          */
                                                          performFlush(scanner, writer, smallestReadPoint, throughputController);
                                                    ——》 StoreFlusher#performFlush()
                                                                                         ▼
                                                 /* 注释:sink = StoreFileWriter
                                                               *   sink = Writer                          *   c = Cell
                                                                */ 
                                                            sink.append(c);
                                                                           ↓
                                                           StoreFileWriter#append()
                                                                            ▼
                     // TODO_MA 注释: 每次溢写的一个HFile,我们都要为其构建一个 bloomfilter
                              appendGeneralBloomfilter(cell);
                               appendDeleteFamilyBloomFilter(cell);

                               // TODO_MA 注释: 写出cell到文件
                             writer.append(cell);
                            trackTimestamps(cell);
                                                               ↓
                                      HFileWriterImpl.append(cell)
                                                              ▼
                    / *   注释:
                        *   1、hbase的底层都是存储的 二进制字节数据
                        *   2、encode  编码, 事实上充当写出的动作 
                        */
                      this.unencodedDataSizeWritten += this.dataBlockEncoder.encode(cell, 
                       this.encodedDataSizeWritten += this.userDataStream.size() - posBeforeEncode;
                                                               ↓
                                         NoOpDataBlockEncoder#encode
                                       ——》 NoneEncoder#write 
                                                                       ▼                                                          
                                                          /* : 真正写出数据
                                                             *   数据终于写到 HFile 中了,完全符合期望
                                                               *   把一个 Cell 对象,分成10个细节组成,写到 HFile 文件
                                                                *   这个 HFile 文件的 输出流对象就是: out
                                                               */
                                                      int size = KeyValueUtil.oswrite(cell, out, false);
                                                                       ▼   
                                                                  /*   把一个 Cell 对象,分成10个细节组成,写到 HFile 文件
                                                                   *   这个 HFile 文件的 输出流对象就是: out
                                                                  */
                                      // 注释: 写出 rowkey 数据
                                       out.write(cell.getRowArray(), cell.getRowOffset(), rlen);
                                       //  注释: 写出 family length
                                       // Write cf - 1 byte of cf length followed by the family bytes
                                       out.write(flen);
                                       out.write(cell.getFamilyArray(), cell.getFamilyOffset(), flen);
                                       // write qualifier
                                       out.write(cell.getQualifierArray(), cell.getQualifierOffset(), qlen);
                                       // write timestamp
                                       StreamUtils.writeLong(out, cell.getTimestamp());
                                       // write the type
                                       out.write(cell.getTypeByte());
                                         // write value
                                         out.write(cell.getValueArray(), cell.getValueOffset(), vlen);
image.png
3.3 -split分析

reqeustSplit()
HBase2.x源码分析-Compact分析
reqeustCompact()

3.4 -Compact分析

reqeustCompact()

4 Get流程源码分析:

代码入口:
table.get(new Get())

大致流程:
1、首先客户端会请请求zookeepre拿到meta表的位置信息,这个meta表的region到底在那个regionserver1里面
2、发请求请求这个regionserver1扫描这个meta表的数据,确定我要插入的数据rowkey到底在那个用户表的region里面。并且还拿到这个region在那个regioinserver2的信息
3、发送请求,请求regionserver2
1、首先去blockcache ,进行查询 读缓存
2、先去布隆过滤器中进行判断
1、如果判断这个rowkey不存在,则不需要扫描 HFile
2、如果判断这个rowkey存在,则需要扫描HFile

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,928评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,192评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,468评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,186评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,295评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,374评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,403评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,186评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,610评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,906评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,075评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,755评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,393评论 3 320
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,079评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,313评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,934评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,963评论 2 351