登录注册写文章

hadoop调优

hadoop调优

数据输入：

合并小文件

使用CombineTextInputFormat来作为输入

Map阶段

（spill）次数：通过调整io.sort.mb及sort.spill.percent

（merge）次数：通过调整io.sort.factor参数，增大merge的文件数目

combine处理:业务允许部分合并

Reduce阶段

map、reduce共存：调整slowstart.completedmaps

设置buffer直接输送到reduce中：mapred.job.reduce.input.buffer.percent

压缩阶段

使用snappy压缩

JVM重用

mapreduce.job.jvm.numtasks

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

MapReduce过程详解及其性能优化
MapReduce过程详解及其性能优化 [toc] 转载：MapReduce过程详解及其性能优化总结详情从J...
小小少年Boy阅读 7,126评论 2赞 18
MapReduce原理
要知道怎么对MapReduce作业进行调优前提条件是需要对Map-Reduce的过程了然于胸。 Map Side ...
在路上很久了阅读 888评论 0赞 0
Hadoop Mapreduce shuffle 过程详解
转载自:https://my.oschina.net/u/2293326/blog/607540 欢迎阅读原创。 ...
陌城小川阅读 3,872评论 0赞 4
##数据仓库中的SQL性能优化（Hive篇）
数据仓库中的SQL性能优化（Hive篇） - 简书 http://www.jianshu.com/p/808a5...
葡萄喃喃呓语阅读 4,643评论 0赞 31
坚定信念，努力向前
已经上大学差不多有一年了，感觉自己正在逐渐堕落。然而，最近自己不知道怎么了，突然感觉觉醒了一般，让自己明白，这，...
张子州阅读 311评论 0赞 0

赞1赞

赞赏

手机看全文