MapReduce的工作过程主要分为两个阶段:map阶段和reduce阶段。每个阶段都是键值对最为输入和输出,而通常定义map函数和reduce函数。
比如一个气象收集频平台,通过Map函数找出年份和气温,map主要是建立数据使用Reduce能够在这个基础上运行,并且初步进行数据清洗,比如去丢一些缺失的,不可靠的气温数据
比如下面输入几行示例输入数据
对应的是input的键值对<k1,v1>其中k1代表的是偏移量,而v1代表的是数据。
然后根据上面的input提取出年份和气温提取数据(粗体显示)