关于hbase、spark、hive使用时的优化问题

一、Hbase的优化

1、JVM优化：

1）如：HBase RegionServer 的 Java 配置选项

-XX:+UseParNewGC （设置年轻代为并行收集）-XX:+UseConcMarkSweepGC（使用CMS内存收集） -XX:CMSInitiatingOccupancyFraction=70（使用cms作为垃圾回收使用70％后开始CMS收集） -XX:+CMSParallelRemarkEnabled（降低标记停顿） -XX:+UseCompressedOops （压缩指针，解决内存占用）

2）另外设置合理的zookeeper.session.timeout，默认3分钟（GC回收时间如果超过这个值，zk认为宕机regionserver下线）

2、读写性能优化：

1）HTable.setAutoFlushTo(false)关闭自动刷新，避免一个put就执行更新。开启缓存、客户端达到阈值批量提交给RS。

2）对于日志数据可以临时关闭WAL增加性能。

3）建议少的列族（最优不超过3）原因1 多个列族意味着多个memstore，内存使用大效率低。原因2 假设列族1 数据量大，列族2数据量很少，region分裂时两个都会分裂，造成列族2分裂到不同的多个region上造成查询效率低。

4）设置Bloomfilter提升读写性能定位在那个hfile上r；

5）设置hbase压缩。

6）设置hbase.regionserver.handler.count处理RPC线程数，默认10，不是越大越好（OOM）

7）在离线批量读取请求时设置禁用缓存，scan.setBlockCache(false)

8）region拆分：rowkey设d计预分区，保证散列，读写压力均衡

二、Spark优化

1、预估好资源使用情况，通过submmit时的配置参数申请资源。根据core根据资源设置合理的并行度

2、注意数据倾斜，在shuffle阶段，如distinct,groupbykey,join,repartition等，看是在那个stage,那个task。抽样数据，确定是什么key导致，可以通过hive预处理聚合，或者过滤这些key，单独计算；或者预处理采用两步聚合，比如key前加个随机数，聚合一次，去掉随机数再聚合；

3、另外大表join小表情况采用mapjoin（broadcast+map），

4、算子的使用，了解执行原理，比如reducebykey对比groupbykey的效果，repartion对比Coalesce，以及map和mappartition等等，对于可复用的RDD使用cache,persist或者checkpoint等缓存，以及尽量减少shuffle。

三、hive优化

1、排序：orderby,sortby等几种类型排序的选择（详细见发布的另外一篇文章）

2、存储类型优化：详细见：快速理解Hive的数据存储格式及mapreduce底层原理

3、根据数据量设置合理的map、reduce数量

4、其他：如查询的过滤条件必须加入分区筛选， join操作对于大表关联小表时采用map join，对于普通量级别的数据采用即席查询的mpp引擎（presto,impala等等）

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 214,172评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 91,346评论 3赞 389
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 159,788评论 0赞 349
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 57,299评论 1赞 288
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 66,409评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 50,467评论 1赞 292
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,476评论 3赞 412
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,262评论 0赞 269
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,699评论 1赞 307
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,994评论 2赞 328
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,167评论 1赞 343
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,827评论 4赞 337
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,499评论 3赞 322
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,149评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,387评论 1赞 267
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,028评论 2赞 365
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,055评论 2赞 352

关于hbase、spark、hive使用时的优化问题

推荐阅读更多精彩内容