一、简述
Hadoop是一个开源、高可靠、可扩展的分布式计算框架。
二、解决的问题
海量数据的存储(HDFS),海量数据的分析(MapReduce),分布式资源调度(Yarn)
三、可靠性
Hadoop能自动维护数据的多份副本,并且在任务失败后能自动重新部署
四、Hadoop生态圈

五、Hadoop核心
Hadoop项目主要包括以下四个模块
Hadoop Common:为其他Hadoop模块提供基础设施。
Hadoop HDFS:一个高可靠、高吞吐量的分布式文件系统
Hadoop MapReduce:一个分布式的离线并行计算框架
Hadoop YARN:一个新的MapReduce框架,任务调度与资源管理