hadoop 默认的分桶规则:
在mapper阶段,mapper的输出以“\t”为间隔,前面的是key后面的是value,会按照相同的key放在一个mapper中
如果需要自己修改可以参考下面的链接
专业版本的介绍:http://www.dreamingfish123.info/?p=1102
hadoop 默认的分桶规则:
在mapper阶段,mapper的输出以“\t”为间隔,前面的是key后面的是value,会按照相同的key放在一个mapper中
如果需要自己修改可以参考下面的链接
专业版本的介绍:http://www.dreamingfish123.info/?p=1102