240 投稿
收录了7篇文章 · 20人关注
  • Resize,w 360,h 240
    CDH 5.x 离线安装指南

    简述 hadoop 体系衍生了许多商业发行版,其中国内最常用的是 CDH。CDH是在原生 apache hadoop 的基础上封装的发行版,拥有...

    0.1 mtide 1 13
  • Resize,w 360,h 240
    CDH 5.x 完全卸载指南

    注意备份用户数据 建议在卸载CDH前,先备份或转移集群上的用户数据。以下路径是默认安装配置下的用户数据所在目录: 停止所有服务 打开 Cloud...

    0.1 mtide 0 4
  • Resize,w 360,h 240
    Storm 性能优化

    目录 场景假设 调优步骤和方法 Storm 的部分特性 Storm 并行度 Storm 消息机制 Storm UI 解析 性能优化 场景假设 在...

    0.9 mtide 30 60 1
  • hadoop HA+Federation(高可用联邦)模式搭建指南

    简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。HA联邦模式解决了单纯HA模式的性能瓶颈(主要指Namenode、...

    0.4 mtide 8 20
  • hadoop HA高可用集群模式搭建指南

    简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。HA模式的集群里面会部署两台NN(最多也只能两台),以形成主备NN...

    0.8 mtide 0 10
  • hadoop 完全分布式搭建指南

    简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。完全分布式模式将hadoop部署在至少两台机子上,数据块副本的数量...

  • hadoop 伪分布式搭建指南

    简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。伪分布式模式将hadoop安装在一台机器上,通常用来用作实验、开发...

  • hadoop 生态圈介绍

    @(blog) 简介 Hadoop 是一个能够处理海量数据的分布式系统基础软件框架,理论上能够通过增加计算节点以处理无限增长的数据,由java写...

    0.1 mtide 1 6

专题公告

hadoop 相关的开发技术专题。主要围绕 hadoop 生态圈、spark 生态圈进行技术分享和交流。