240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Hadoop学习笔记(5)-MapReduce

    自行整理, 学习用途, 侵知删歉 一.MapReduce定义 MP是一种编程模型 记录导向的数据处理方式(键值对) 帮助多节点下的任务分配 由M...

  • Resize,w 360,h 240
    Hadoop学习笔记(4)-Sqoop

    自行整理, 学习用途, 侵知删歉 一. 定义 Sqoop是SQL-to-Hadoop数据库导入工具, 从RDBMSs(Relational Da...

  • Resize,w 360,h 240
    Hadoop学习笔记(3)-Flume

    自行整理, 学习用途, 侵知删歉Flume的设计目标: 可靠性, 可量测性, 可扩展性 Agent将数据写成多种HDFS文件格式(text, S...

  • Resize,w 360,h 240
    Hadoop学习笔记(2)-HDFS

    自行整理, 学习用途, 侵知删歉 NameNode内存分配 当一个NameNode运行的时候, 所有的metaData都储存在RAM中(快速响应...

  • Resize,w 360,h 240
    Hadoop学习笔记(1)-HDFS

    自行整理, 学习用途, 侵知删歉 1.HDFS 新加入的文件被分成block, 64M默认; 默认每一个block复制3份,分布在多台node上...

  • Resize,w 360,h 240
    GlusterFS 学习笔记

    自行整理, 学习用途, 侵知删歉 一.术语介绍 来源http://gluster.readthedocs.io/en/latest/Quick-...

  • Java的WordCount实现

    WordCount 是用来统计一个文件中相同单词出现次数的程序, 是一个可以用来描述Spark运行的经典问题:通过将单词拆分映射(map)和对映...