240 投稿
收录了17篇文章 · 4人关注
  • Resize,w 360,h 240
    Sqoop的导入导出

    sqoop的功能架构 sqoop是能够在hdfs和关系型数据库之间进行数据量大的数据转换工具,底层运行的是mapreduce项目,是Apache...

  • Resize,w 360,h 240
    HDFS详解

    认识HDFS HDFS的特点: 高容错性高吞吐量故障的检测和自动快速恢复流式的数据访问大数据集一次写入,多次读写 HDFS不适用的场景 不支持大...

    0.2 Bloo_m 6 8
  • Resize,w 360,h 240
    淘宝大数据之路

    2003年至今淘宝网从零开始飞速发展,走过了13个年头,支撑淘宝业务野蛮式生长背后是一套不断完善的技术平台,淘宝大数据平台,就是其中非常重要的一...

  • Resize,w 360,h 240
    【容错篇】Spark Streaming的还原药水——Checkpoint

    一个 Streaming Application 往往需要7*24不间断的跑,所以需要有抵御意外的能力(比如机器或者系统挂掉,JVM crash...

  • Resize,w 360,h 240
    Hadoop实验——Hive的安装和实验

    实验目的 理解Hive在Hadoop体系结构中的角色。 熟悉Hive的DDL命令与DML操作。 区分数据仓库和数据库的概念。 实验平台 操作系统...

    0.2 Tiny_16 7 14 1
  • Resize,w 360,h 240
    MapReduce shuffle过程浅析

    整个shuffle的流程图 Map Shuffle的作用以及相应的设置 partition过程:输入的<key,value>对经过map()处理...

  • Resize,w 360,h 240
    离线安装hadoop最新发行版本hdp2.4

    hdp2.4是hortworks最新推出的100%开源的hadoop发行版本,其中包含了最新的spark 1.6,冲着这点,使用离线方式安装最新...

  • Resize,w 360,h 240
    hadoop笔记1--单机和伪分布式模式

    hadoop是处理大数据的得力帮手,它主要分为三种模式: 单机模式;伪分布式模式;完全分布式模式; 在这篇文章中,主要来看看在CentOS7中进...

  • Hadoop学习资源

    聊到大数据技术,当然是少不了hadoop,这只可爱的小象。这两年的大数据技术十分火爆,今天我就为大家整理了hadoop的学习资料。希望各位学习者...

  • Resize,w 360,h 240
    Scala基础语法(二)

    List集合 list是一个有序且可以重复的序列。 创建list集合 List(elem1, elem2...)这些元素可以不是同一类型 lis...

专题公告

大数据技术和结合实际的应用