hadoop-2.7.3集群的搭建

  • 设置静态IP

  • 关闭防火墙(如果没有关闭,上传文件到hdfs会出错,还存在其他错误)

  • 在hadoop-2.7.3\etc\hadoop\目录下修改配置文件

    1. 配置hadoop-env.sh
    • 设置JAVA_HOME

    • 配置yarn-env.sh

    • 配置JAVA_HOME

    • 配置slaves

      • 清空并添加
        slave1
        slave2
    • 配置core-site.xml,添加属性
      <--用来指定HDFS老大(NameNode)的地址-->
      <property>
      <name>fs.defaultFS</name>
      <value>hdfs://master:9000</value>
      </property>
      <--用来指定在序列文件中读写缓冲区的大小(128M)-->
      <property>
      <name>io.file.buffer.size</name>
      <value>131072</value>
      </property>
      <--用来指定Hadoop运行时产生文件的存放目录-->
      <property>
      <name>hadoop.tmp.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/tmp</value>
      <description>Abase for other temporary directories.</description>
      </property>

    • 配置hdfs-site.xml,添加属性

      <property>
      <name>dfs.namenode.secondary.http-address</name>
      <value>master:9001</value>
      </property>
      <property>
      <name>dfs.namenode.name.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/hdfs/name</value>
      </property>
      <property>
      <name>dfs.datanode.data.dir</name>
      <value>file:/usr/app/install/hadoop-2.7.3/hdfs/data</value>
      </property>
      <--指定HDFS保存数据副本的数量-->
      <property>
      <name>dfs.replication</name>
      <value>3</value>
      </property>
      <property>
      <name>dfs.webhdfs.enabled</name>
      <value>true</value>
      </property>
      <--指定block大小为128M-->
      <property>
      <name>dfs.blocksize</name>
      <value>134217728</value>
      </property>

    • 配置mapred-site.xml

      <property>
      <name>mapreduce.framework.name</name>
      <value>yarn</value>
      </property>
      <property>
      <name>mapreduce.jobhistory.address</name>
      <value>master:10020</value>
      </property>
      <property>
      <name>mapreduce.jobhistory.webapp.address</name>
      <value>master:19888</value>
      </property>

    • 配置yarn-site.xml

      <property>
      <name>yarn.nodemanager.aux-services</name>
      <value>mapreduce_shuffle</value>
      </property>
      <property>
      <name>yarn.resourcemanager.address</name>
      <value>master:8032</value>
      </property>
      <property>
      <name>yarn.resourcemanager.scheduler.address</name>
      <value>master:8030</value>
      </property>
      <property>
      <name>yarn.resourcemanager.resource-tracker.address</name>
      <value>master:8031</value>
      </property>
      <property>
      <name>yarn.resourcemanager.admin.address</name>
      <value>master:8033</value>
      </property>
      <property>
      <name>yarn.resourcemanager.webapp.address</name>
      <value>master:8088</value>
      </property>

  • ssh无密钥登录

  • 复制Hadoop配置好的包到其他Linux主机

  • 通过./bin/hdfs namenode -format 格式化hdfs

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。HA联邦模式解决了单纯HA模式的性能...
    mtide阅读 13,271评论 8 20
  • 1 目的将hadoop 2.7.1 安装到 166、167、168 三台机器上2 提供环境练习环境192.168....
    灼灼2015阅读 3,456评论 4 40
  • 之前的有点忘记了,这里在云笔记拿出来再玩玩.看不懂的可以留言 大家可以尝试下Ambari来配置Hadoop的相关环...
    HT_Jonson阅读 3,024评论 0 50
  • 简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。HA模式的集群里面会部署两台NN(最...
    mtide阅读 7,141评论 0 10
  • 不知从什么时候开始,沉默成了唯一的武器。痛苦的时候,有反对意见的时候,愤怒的时候,低落的时候,甚至……开心的时候…...
    尘潇潇阅读 151评论 0 0