Hbase初窥

Hbase能做什么

  • 海量数据的存储
  • 海量数据的查询

企业数据海量查询

项目需求功能

  • 海量数据
  • 实时查询
  • 场景复杂

数据采集
sqoop(flume)
kettle

Hbase基本信息

  • 企业用的比较多的版本0.98,0.98是针对hadoop 2.2编译的,需要替换jar包
  • 只有表名和列簇,rowkey唯一

Hbase体系架构

Master
RegionServer

部署

  • 安装解压后,配置文件再conf目录下
    hbase-env.sh
    hbase-site.xml
    regionserver
  • 启动
    start-hbase.sh
  • 查看端口 60010 (如果发现Hadoop版本不对,需要手动更换jar包)
  • 停止stop-hbase.sh

hbase shell使用

进入: hbase shell
查看表 :list
查看帮助 help 'command'
查看表信息 :describle tablename
只有插入和查询
插入put 'tablename' '列簇' '列名' 'value'
查询

  • 依据rowkey进行查询 get
    get 'tablename' '列簇'
  • 范围查询:scan range
  • scan

Hbase 物理模型

  • table中的所有行都按照rowkey的字典序进行排序
  • table在行的方向上分割为多个Region
  • region是按照大小分割的,每个表开始时只有一个region随着数据增大增大
  • region是分布式存储的最小单元
  • 存储的最小单元是cell

Hbase 数据写入流程

  • put -》cell
  • wal 预写日志
  • memstore
  • spool -》hdfs

总结:

1 查询时效:准实时,秒级别
2 基于HDFS:数据安全性,普通商用机即可
3 协作框架zookeeper
4 table:columnfamily,rowkey
5 列式存储 nosql=not only sql

region
默认情况下,会创建一个表,只有一个region
startkey:null
endkey:null

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • HBase那些事 @(大数据工程学院)[HBase, Hadoop, 优化, HadoopChen, hbase]...
    分痴阅读 9,431评论 3 17
  • 最近在逐步跟进Hbase的相关工作,由于之前对Hbase并不怎么了解,因此系统地学习了下Hbase,为了加深对Hb...
    飞鸿无痕阅读 50,493评论 19 272
  • 比特科技: 存储、数据库、大数据技术 » HBase原理和设计 http://www.bitstech.net/...
    葡萄喃喃呓语阅读 4,014评论 0 11
  • 简介 [HBase]——Hadoop Database的简称,Google BigTable的另一种开源实现方式,...
    高广超阅读 7,091评论 1 27
  • 1. HBase介绍,Hbase是什么? HBase -- Hadoop Database ,是一个高可靠、高性能...
    奉先阅读 9,263评论 1 36

友情链接更多精彩内容