初始Hadoop

一、大数据的定义

        大数据=5V+1C

        5V:variety(多样化),volume(海量),velocity(快速),vitality(灵活),value(价值)

        1C:complexity(复杂性)


二、hadoop的定义

       广义:以hadoop为主的生态圈,包括hadoop,flume......

       狭义:hadoop=Apache hadoop——网址:hadoop.apache.org


三、hadoop的三大组件

       三大组件:存储、计算、资源和作业调度

       hadoop的三个版本:hadoop1.x,hadoop2.x,hadoop3.x

       hadoop1.x:HDFS(存储)+MapReduce(计算、资源和作业调度)

       hadoop2.x:HDFS(存储)+MapReduce(计算)+YARN(资源和作业调度平台)

注:目前企业多用hadoop2.x,HDFS和MapReduce都是跑在YARN平台上。


©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 之前的有点忘记了,这里在云笔记拿出来再玩玩.看不懂的可以留言 大家可以尝试下Ambari来配置Hadoop的相关环...
    HT_Jonson阅读 3,048评论 0 50
  • 1.Hadoop概述 是什么:Apache™Hadoop项目是可靠,可扩展,分布式计算、分布式存储的开源软件。Ap...
    Aimerwhy阅读 203评论 0 0
  • Hadoop、HBase、Hive、Spark分布式系统架构,本文通过全套部署方法来让大家深入系统内部以充分理解...
    0o失魂鱼o0阅读 2,895评论 0 30
  • 永远都不会忘记,你给我的温柔,夜色下的玫瑰,在笑声,歌声中荡漾
    a26c235c451b阅读 123评论 0 0
  • 1.新教育理想课堂的第三重境界:知识、社会生活与师生生命的共鸣,一定是建立在第一重境界(落实有效教学框架)和第二重...
    赵利文阅读 234评论 0 0