HBase写性能调优

HBase服务器端优化

  1. Region是否太少?

优化原理:当前集群中表的Region个数如果小于RegionServer个数,即Num(Region of Table) < Num (RegionServer),可以考虑切分Region并尽可能分布到不同的RegionServer上以提高系统请求并发度。

优化建议:在Num (Region of Table) < Num (RegionServer)的场景下切分部分请求负载高的Region,并迁移到其他RegionServer。

  1. 写入请求是否均衡?

优化原理:写入请求如果不均衡,会导致系统并发度较低,还有可能造成部分节点负载很高,进而影响其他业务。分布式系统中特别需要注意单个节点负载很高的情况,单个节点负载很高可能会拖慢整个集群,这是因为很多业务会使用Mutli批量提交读写请求,一旦其中一部分请求落到慢节点无法得到及时响应,会导致整个批量请求超时。

优化建议:检查Rowkey设计以及预分区策略,保证写入请求均衡。

HBase客户端优化

  1. 是否可以使用Bulkload方案写入?

Bulkload是一个MapReduce程序,运行在Hadoop集群。程序的输入是指定数据源,输出是HFile文件。HFile文件生成之后再通过LoadIncrementalHFiles工具将HFile中相关元数据加载到HBase中。Bulkload方案适合将已经存在于HDFS上的数据批量导入HBase集群。相比调用API的写入方案,Bulkload方案可以更加高效、快速地导入数据,而且对HBase集群几乎不产生任何影响。

  1. 是否需要写WAL? WAL是否需要同步写入?

优化原理:数据写入流程可以理解为一次顺序写WAL+一次写缓存,通常情况下写缓存延迟很低,因此提升写性能只能从WAL入手。HBase中可以通过设置WAL的持久化等级决定是否开启WAL机制以及HLog的落盘方式。WAL的持久化分为四个等级:SKIP_WAL,ASYNC_WAL,SYNC_WAL以及FSYNC_WAL。如果用户没有指定持久化等级,HBase默认使用SYNC_WAL等级持久化数据。在实际生产线环境中,部分业务可能并不特别关心异常情况下少量数据的丢失,而更关心数据写入吞吐量。比如某些推荐业务,这类业务即使丢失一部分用户行为数据可能对推荐结果也不会构成很大影响,但是对于写入吞吐量要求很高,不能造成队列阻塞。这种场景下可以考虑关闭WAL写入。退而求其次,有些业务必须写WAL,但可以接受WAL异步写入,这是可以考虑优化的,通常也会带来一定的性能提升。

优化推荐:根据业务关注点在WAL机制与写入吞吐量之间做出选择,用户可以通过客户端设置WAL持久化等级。

  1. Put是否可以同步批量提交?

优化原理:HBase分别提供了单条put以及批量put的API接口,使用批量put接口可以减少客户端到RegionServer之间的RPC连接数,提高写入吞吐量。另外需要注意的是,批量put请求要么全部成功返回,要么抛出异常。

优化建议:使用批量put写入请求。

  1. Put是否可以异步批量提交?

优化原理:如果业务可以接受异常情况下少量数据丢失,可以使用异步批量提交的方式提交请求。提交分两阶段执行:用户提交写请求,数据写入客户端缓存,并返回用户写入成功;当客户端缓存达到阈值(默认2M)后批量提交给RegionServer。需要注意的是,在某些客户端异常的情况下,缓存数据有可能丢失。

优化建议:在业务可以接受的情况下开启异步批量提交,用户可以设置setAutoFlush (false)

  1. 写入KeyValue数据是否太大?

KeyValue大小对写入性能的影响巨大。一旦遇到写入性能比较差的情况,需要分析写入性能下降是否因为写入KeyValue的数据太大。KeyValue大小对写入性能影响曲线如图


性能曲线变化

横坐标是写入的一行数据(每行数据10列)大小,左纵坐标是写入吞吐量,右纵坐标是写入平均延迟(ms)。可以看出,随着单行数据不断变大,写入吞吐量急剧下降,写入延迟在100K之后急剧增大。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,657评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,889评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,057评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,509评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,562评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,443评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,251评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,129评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,561评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,779评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,902评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,621评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,220评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,838评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,971评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,025评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,843评论 2 354

推荐阅读更多精彩内容