MapReduce
一种并行编程模型,用于大规模数据处理任务
设计理念
计算向数据靠拢 减小网络中数据传输开销
框架
Master(运行JobTracker)/Slave(运行TaskTracker)架构
模型核心
Map函数和Reduce函数
MapReduce体系结构
MapReduce工作流程
核心思想:“分而治之”
一种并行编程模型,用于大规模数据处理任务
计算向数据靠拢 减小网络中数据传输开销
Master(运行JobTracker)/Slave(运行TaskTracker)架构
Map函数和Reduce函数
核心思想:“分而治之”