HBase介绍之概念

简介
Base是Apache Hadoop的数据库,能够对大数据提供随机、实时的读写访问功能,HBase是Bigtable的开源山寨版本,是建立在HDFS之上,提供高可靠性、高性能、列存储、可伸缩、实时读写的数据库系统.
HBase存储的是松散型的数据,它介于Nosql和RDBMS之间,仅通过主键(row key)和主键的range来检索数据,仅支持单行事务(可通过hive支持来实现多表join等复杂操作).主要用来存储非结构化和半结构化的松散数据,与hadoop一样,Hbase目标主要依靠横向扩展,通过不断增加廉价的商用服务器,来增加计算和存储能力,但与hadoop相比,Hbase所要求的服务器性能要比hadoop的高。

体系结构


Paste_Image.png

HBase的服务器体系结构遵从简单的主从服务器架构,它由HRegion服务器(HRegion Server)和HMaster 服务器组成。HMaster负责管理所有的HRegion服务器,而HBase中的所有的服务器都是通过zookeeper来进行协调并处理HBase服务器运行期间可能遇到的错误。HBase Master并不存储HBase中的任何数据.HBase逻辑上的表可能会被划分成多个HRegion,然后存储到HRegion服务器中,HBase Master服务器中存储的是从数据到HRegion 服务器的映射。因此,HBase体系结构如图所示:

HRegion

当表的大小超过设置值的时候,HBase会自动地将表划分为不同的区域,每个区域包含所有行的一个子集.对用户来说,每个表是一堆数据的集合,靠主键来区分。从物理上来说,一张表是被拆分成了多块,每一个块就是一个HRegion.我们用表名+开始/结束 主键来区分每一个HRegion。一个HRegion会保存一个表里面的某段连续的数据,从开始主键到结束主键,一张完整的表格是保存在多个HRegion上面的。

HRegion服务器

HRegion服务器包含两大部分:HLOG部分和HRegion部分,其中HLOG部分是用来存储数据日志,采用的是WAL(先写日志)的方式.HRegion部分是由很多的Store部分组成的,存储的是实际的数据,而Store是由MemStore和StoreFile组成的,每一个Store实际上存储的是一个列族(Column Family)的数据,当数据到来的时候首先会写到HLOG中,然后写入到MemStore中,而MemStore是驻留在内存中的,当MemStore的大小达到一定的阀值后,会写入到StoreFile(又名HFile),当StoreFile的数量达到一定的阀值后,会进行compact操作,当单个StoreFile文件的大小达到一定的阀值,会将当前的Region进行split操作,产生2个HRegion,同时父HRegion会下线,HMaster会把这2个HRegion分配到其他的HRegionServer上,以此来达到负载均衡

总结下流程:data---->HLOG----->MemStore---->StoreFile---->compact---->Region Split

HBase中不涉及数据的直接删除和更新操作,所有的数据均通过追加的方式进行更新,数据的删除和更新在HBase合并(compact)的时候进行的

Paste_Image.png

HBase Master服务器

HMaster的主要任务就是告诉每个HRegion服务器它要维护哪些HRegion

当一台新的HRegion服务器登录到HMaster服务器时,HMaster会告诉它先等待分配数据.而当一台HRegion死机时,HMaster会把它负责的HRegion标记为未读,然后再把它们分配到其他的HRegion服务器上

HMaster在功能上主要负责table和HRegion的管理工作,具体包括:
1.管理用户对Table的增删改查
2.管理HRegion服务器的负载均衡,调整HRegion的分布
3.在HRegion分裂后,负责新HRegion的分配
4.在HRegion服务器停机后,负责失效HRegion服务器上的HRegion迁移

ROOT和META表

META(元数据):用来区分不同的HRegion的数据,表达符是:表名+开始主键+唯一ID,用此表达符来唯一表示HRegion,而元数据本身也是存储在HReion中的,我们称这个表为元数据表(META)表

ROOT表:保存所有元数据表的位置,根数据表是不能分割的,永远只存在一个

元数据表和根数据表的每一行都包含一个列族(info列族)

ROOT表包含META表所在的区域列表,META表包含所有的用户空间区域列表,以及Region服务器的地址,客户端能够缓存所有的已知的ROOT表和META表,从而提高访问的效率

Zookeeper

zookeeper存储的是HBase中ROOT表和META表的位置.此外,zookeeper还负责监控各个机器的状态(每台机器到Zookeeper中注册一个实例).当某个机器发生故障的时候,zookeeper会第一时间感知到,并通知HBase Master进行相应的处理,同时,当HBase Master发生故障的时候,Zookeeper还负责HBase Master的恢复工作,能够保证在同一时刻系统中只有一台HBase Master提供服务

数据模型

HBase是一个类似BigTable的分布式数据库,它是一个稀疏的长期存储的(存在硬盘上)、多维度的、排序的映射表,这张表的索引是行关键字、列关键字和时间戳,HBase中的数据都是字符串,没有类型

列名字的格式是"<family>:<qualifier>",都是由字符串组成的,每一张表有一个列族集合,这个集合是固定不变的,只能通过改变表结构来改变,但是qualifier值相对于每一行来说都是可以改变的

HBase的写操作是锁行的,每一行都是一个原子元素,都可以加锁

概念视图

我们可以把一个表想象成一个大的映射关系,通过行键,行键+时间戳或行键+列(列族:列修饰符),就可以定位特定数据,HBase是稀疏存储数据的,因此某些列可以是空白的

每一条数据对应的时间戳都用数字来表示,编号越大表示数据越旧,反之表示数据越新

物理视图

在物理存储上面,它是按照列表来保存的

在概念视图上面有些列是空白的,这样的列实际上并不会被存储,当请求这些空白的单元格时,会返回null值

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容