Avatar notebook default
5篇文章 · 4556字 · 1人关注
  • Resize,w 360,h 240
    通俗理解YARN运行原理

    导语:工作中常常和Spark on YARN, Hadoop on YARN打交道,经常在各种日志中摸爬滚打,为提升效率,总结一下YARN的知识...

    0.2 9582 2 13
  • Resize,w 360,h 240
    Hadoop2.0 NameNode HA和Federation简明理解

    引子 为什么需要 NameNode HA 和 Federation ? 1. 规避NameNode单点故障,secondary namenode...

  • Resize,w 360,h 240
    MapReduce理解

    引子 为什么需要MapReduce? 因为MapReduce可以“分而治之”,将计算大数据的复杂任务分解成若干简单小任务。“简单”的意思是:计算...

  • Resize,w 360,h 240
    HDFS理解

    引子 为什么需要HDFS? 因为一个物理计算机的存储已经hold不住我们庞大的数据集。 HDFS的特点是什么? HDFS以流式数据访问模式来存储...

  • hadoop学习路线

    hadoop是一个分布式系统基础架构,主要功能有存储+计算,分别由hdfs和map-reduce模块实现。 hadoop有单机部署、伪分布式部署...

文集作者