Hadoop那点事

一、简述

Hadoop是一个开源、高可靠、可扩展的分布式计算框架。


二、解决的问题

海量数据的存储(HDFS),海量数据的分析(MapReduce),分布式资源调度(Yarn)


三、可靠性

Hadoop能自动维护数据的多份副本,并且在任务失败后能自动重新部署


四、Hadoop生态圈


五、Hadoop核心

Hadoop项目主要包括以下四个模块

Hadoop Common:为其他Hadoop模块提供基础设施。

Hadoop HDFS:一个高可靠、高吞吐量的分布式文件系统

Hadoop MapReduce:一个分布式的离线并行计算框架

Hadoop YARN:一个新的MapReduce框架,任务调度与资源管理

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容