Hadoop是什么

狭义

指Hadoop框架, 大数据必备框架, Apache下开源的分布式系统基础框架, 主要解决海量数据的存储和分析计算问题

广义

指Hadoop生态圈, 包含大量用于大数据储存, 管理, 传输, 分析计算的框架


Hadoop生态圈

Hadoop的三大发行版本

Apache、Cloudera、Hortonworks

  • Apache版本最原始(最基础)的版本,对于入门学习最好
  • Cloudera在大型互联网企业中用的较多
  • Hortonworks文档较好

Hadoop的优势

高可靠, 高扩展, 高容错, 高效

Hadoop组成

Hadoop1.x和Hadoop2.x的区别

Hadoop1.x MapReduce同时处理业务逻辑运算和资源调度, 耦合性高
Hadoop2.x 进行改进, 增加Yarn, Yarn负责任务调度, MapReduce负责运算

大数据生态

大数据生态体系

官方网站

http://hadoop.apache.org/

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容