HBase 高级功能:计数器,可以用于实时统计,而不需要离线批量处理。HBase 有一种机制可以将列当作计数器,支持原子操作,否则用户需要对一行数据加锁,在进行读取更新操作,会引起大量的资源竞争问题。
HBase Client API 提供了专门的方法完整这种读取并修改的操作,在单独的一次客户端调用中保证原子性。早期的 HBase 版本会在每次计数器更新操作调用一次 RPC 请求,新版本中可以在一次 RPC 请求中完成多个计数器的更新操作,但是多个计数器必须在同一行。
计数器使用 Shell 命令行
计数器不需要初始化,创建一个新列时初始值为0,第一次 incr
操作返回1。
计数器使用 incr
命令,增量可以是正数也可以是负数,但是必须是长整数 Long:
incr '<table>','<row>','<column>',['<increment-value>']
计数器使用的例子:
hbase(main):001:0> create 'counters','daily','weekly','monthly'
0 row(s) in 1.2260 seconds
hbase(main):002:0> incr 'counters','20190301','daily:hites',1
COUNTER VALUE = 1
hbase(main):003:0> incr'counters','20190301','daily:hites',1
COUNTER VALUE = 2
hbase(main):004:0> get_counter 'counters','20190301','daily:hites'
COUNTER VALUE = 2
需要注意的是,增加的参数必须是长整型 Long,如果按照错误的格式更新了计数器(如字符串格式),下次调用 incr
会得到错误的结果:
hbase(main):005:0> put 'counters','20190301','daily:clicks','1'
0 row(s) in 1.3250 seconds
hbase(main):006:0> incr'counters','20190301','daily:clicks',1
COUNTER VALUE = 3530822107858468865
单计数器 Java API
操作一个计数器,类似 shell 命令 incr
HTable table = new HTable(conf, "counters");
long cnt1 = table.incrementColumnValue(Bytes.toBytes("20190301"),
Bytes.toBytes("daily"),
Bytes.toBytes("hits"),
1L);
long cnt2 = table.incrementColumnValue(Bytes.toBytes("20190301"),
Bytes.toBytes("daily"),
Bytes.toBytes("hits"),
1L);
多计数器 Java API
使用 Table 的 increment()
方法可以操作一行的多个计数器,需要构建 Increment 实例,并且指定行键:
HTable table = new HTable(conf, "counters");
Increment incr1 = new Increment(Bytes.toBytes("20190301"));
incr1.addColumn(Bytes.toBytes("daily"), Bytes.toBytes("clicks"),1);
incr1.addColumn(Bytes.toBytes("daily"), Bytes.toBytes("hits"), 1);
incr1.addColumn(Bytes.toBytes("weekly"), Bytes.toBytes("clicks"), 2);
incr1.addColumn(Bytes.toBytes("weekly"), Bytes.toBytes("hits"), 2);
Result result = table.increment(incr1);
for(Cell cell : result.rawCells()) {
// ...
}
Increment 类还有一种构造器:
Increment(byte[] row, RowLock rowLock)
rowLock
参数可选,可以设置用户自定义锁,可以限制其他写程序操作此行,但是不保证读的操作性。
References:
《HBase 权威指南》