240 发简信
IP属地:广东
  • Resize,w 360,h 240
    Hfile结构

    Hfile结构 文件主要分为四个部分:Scanned block section,Non-scanned block section,Openi...

  • Resize,w 360,h 240
    HBase知识点

    介绍 HBase是一个构建在HDFS上的分布式列存储系统; HBase是基于Google BigTable模型开发的,典型的key/value系...

  • Resize,w 360,h 240
    Hive知识点

    hive介绍 Hive通常意义上来说,是把一个SQL转化成一个分布式作业,如MapReduce,Spark或者Tez。无论Hive的底层执行框架...

  • Resize,w 360,h 240
    Yarn知识

    Year的资源管理模型 在实际系统中,资源本身是多维度的,包括CPU、内存、网络I/O和磁盘I/O等,因此,如果想精确控制资源分配,不能再有sl...

  • Resize,w 360,h 240
    MapReduce 知识

    参与mapreduce作业执行涉及4个独立的实体: 客户端(client)提交MapReduce作业JobTracker1.作业调度:将一个作业...

  • Resize,w 360,h 240
    HDFS 2.0 的 HA 实现

    HDFS 2.0 的 HA 实现 Active NameNode 和 Standby NameNode:两台 NameNode 形成互备,一台处...

  • Resize,w 360,h 240
    HDFS知识

    hdfs架构设计 HDFS主要由3个组件构成,分别是NameNode、SecondaryNameNode和DataNode,HSFS是以mast...

  • Resize,w 360,h 240
    Storm知识点

    1.1 简单介绍 实时处理Stream流的能力,有容错性,保证性处理机制。对于输入数据,支持消息队列,像RabbitMQ, JMS, Kafka...

  • storm kafka

    1.1 KafkaSpout流程 建立zookeeper客户端,在zookeeper "borkers/topics/" + _topic + ...