Hadoop权威指南第2章笔记

MapReduce 是一种可用于数据处理的编程模型. Hadoop 可以运行各种语言版本的 MapReduce 程序. 将看到同一个程序的 Java, Ruby, Python 和 C++ 语言版本. MapReduce 程序本质上是并行运行的, 可以将大规模的数据分析任务分发给任何一个拥有足够多机器的数据中心.

2.3 使用 Hadoop 来分析数据

2.3.1 map 和 reduce

  • map 阶段
  • reduce 阶段


    image.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容