本文将介绍一些开发以及运维工作中经常用到的 Hbase Shell 命令。作为开发以及运维人员这些常用命令是需要了解并经常使用的,当然可以不必将他们死记硬背下来。如果在某些场景下想到需要使用某个命令,但是又不知道具体的使用方法时,可以扫一眼这篇文章(熟练使用 mysql 命令的用户可能会觉得 hbase shell 命令的设计有点费解--!)。
Hbase Shell 为 Hbase 提供了一套“简单方便”的命令行工具。使用它可以很好地与 Hbase 进行交互,例如查看 Hbase 集群状态、对 Hbase 数据进行增删改查操作等等。启动 Hbase 之后,我们可以通过 "hbase shell" 来进入 Hbase Shell 命令行。
Hbase Shell 中运行 help 命令可以看到有哪些命令可以使用。这些命令按照功能范围被分成了很多组(Command Groups),每组都包含了若干个命令。本文我选取几个日常工作中常用的命令来进行介绍(对其他命令感兴趣的朋友,可以逐个百度或者 google 进行了解),这些命令主要分布在 general(通用)、ddl(data manipulation language:数据操作语言)、dml(data definition language:数据定义语言) 这些分组中。
General
- status
- version
- table_help
- whoami
status
status 命令显示 hbase 集群的状态,包括 master、region server 的数量和活跃情况,还包括集群的负载情况。
并且,我们还可以在 status 后面加上 'simple'、'summary' 或者 'detauled' 字段来获取更加详细的信息。这里,不加任何字段的 status 等同于 status 'summary'。
version
version 命令很好理解,就是查看 hbase 版本了。
table_help
一些关于表操作命令的帮助介绍(Help for table-reference commands)。
whoami
查询当前的 hbase 用户
DDL & DML
DDL 和 DML 这两类命令是工作中经常需要使用到的,并且两者关联性较大,所以这里将 这两类的命令放在一起讲解。
- list
- exists
- create
- describe
- put
- count
- scan
- get
- delete
- deleteall
list
列出数据库中所有表
exists
判断表是否存在
用法: exists '表名'
create
创建表
用法: create '表名','列族1','列族2'
hbase(main):007:0> create 'kooola','cf1','cf2'
例如上面的语句就创建了拥有两个列族(cf1、cf2)的表,表名为kooola
describe
查看表的结构
用法: describe '表名'
hbase(main):010:0> describe 'kooola'
Table kooola is ENABLED
kooola
COLUMN FAMILIES DESCRIPTION
{NAME => 'cf1', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLO
CKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}
{NAME => 'cf2', BLOOMFILTER => 'ROW', VERSIONS => '1', IN_MEMORY => 'false', KEEP_DELETED_CELLS => 'FALSE', DATA_BLOCK_ENCODING => 'NONE', TTL => 'FOREVER', COMPRESSION => 'NONE', MIN_VERSIONS => '0', BLO
CKCACHE => 'true', BLOCKSIZE => '65536', REPLICATION_SCOPE => '0'}
2 row(s) in 0.0360 seconds
显而易见,查看刚刚创建的 kooola 表,发现有两个列族:cf1 和 cf2
put
向指定表插入数据
用法: put '表名','rowkey','列族:列名','值'。
列簇下的列不需要提前创建,插入值时通过'列族:列名'来指定就行,这意味着 hbase 对表结构的要求更加灵活
hbase(main):013:0> put 'kooola','xxxxxx1','cf1:name','march'
例如上面的命令,就是向 kooola 表中插入一行数据,其中 rowkey 为 xxxxxx1,cf1 列族的 name 列有一个值为 march
count
查询表的记录数
用法:count '表名'
hbase(main):002:0> count 'kooola'
1 row(s) in 0.0320 seconds
scan
查询表数据
用法: scan '表名'
当然你也可以增加一些过滤器来指定查询条件。
我们可以认识一些关键字,例如 COLUMN 和 COLUMNS 进行列族、列过滤;STARTROW 和 STOPROW 用以标识起始、终止rowkey;LIMIT 指定查询的个数;VERSIONS 指定版本。
hbase(main):001:0> scan 'kooola'
查询所有数据
scan 'kooola', {COLUMN=>'cf1'}
指定列族进行查询
scan 'kooola', {COLUMNS=> 'cf1:name'}
指定列进行查询
scan 'kooola', { STARTROW => 'xxxxxx1', LIMIT=>2, VERSIONS=>1}
rowkey 从 xxxxxx1 开始查询 2 个版本为 1 的记录
scan 'kooola', {COLUMNS => ['cf1', 'cf2'], LIMIT => 10, STARTROW => 'xxxxxx1'}
rowkey 从 xxxxxx1 开始查询 10 条记录,记录只显示列族为 cf1 和 cf2 的值
例外我们也可以使用 FILTER 对值进行过滤
scan 'kooola',FILTER=>"RowFilter(=,'binary:xxxxxx1')"
查询 rowkey 为 xxxxxx1 的记录
scan 'kooola',FILTER=>"RowFilter(>,'binary:xxxxxx1')"
查询 rowkey 大于 xxxxxx1 的记录
scan 'kooola',FILTER=>"RowFilter(=,'substring:xxx1')"
查询 rowkey 中包含 xxx1 的记录
scan 'kooola',FILTER=>"ValueFilter(=,'binary:march')"
查询拥有 march 值的记录
scan 'kooola',FILTER=>"ValueFilter(=,'substring:arch')"
查询值包含 arch 的记录
scan 'kooola',FILTER=>"PrefixFilter('xxxx')"
查询 rowkey 前缀为 xxxx 的记录
get
获取行或单元的值
用法:
get '表名','rowkey'
get '表名','rowkey','列族'
get '表名','rowkey','列族:列'
get 'kooola','xxxxxx1'
get 'kooola','xxxxxx1','cf1:name'
delete
使用 delete 命令,可以在一个表中删除特定单元格
用法:
delete '表名', 'rowkey', '列族:列'
deleteall
使用“deleteall”命令,可以删除一行中所有单元格
deleteall '表名', 'rowkey'