mapreduce流程理解

自定义的mapper和reduce类作为两个阶段的任务处理类

mapper类:

setup();     map();     cleanup();       run();  

setup是用类似进行map前的一些准备工作;map承担主要的处理工作;cleanup则是收尾工作如关闭文件或者执行map后的k-v分发等;

run提供了setup到map到cleanup的执行模板。

reducer类

reduce;     configure;     close;

主要使用reduce方法


job类使用

先实例化

Job job = new Job(config);

需要设置job执行作业的输入和输出文件的路径

设置任务处理类

设置输出的key和value的类型

执行job     job.waitForCompletion(true);

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容