二、Hadoop2.x分布式集群部署-YARN
一、配置 一台ResourceManage和三台NodeManager

1.yarn分布式部署

1.Yarn-env.sh
配置java环境变量

2.Yarn-site.xml
http://hadoop.apache.org/docs/r2.5.2/hadoop-yarn/hadoop-yarn-common/yarn-default.xml

2.mapreduce部署

1.mapred-env.sh
配置java环境变量与参数

2.mapred-site.xml

3.将配置转移到其他虚拟机
以转到第二台虚拟机为例
scp -r ./* kfk@bigdata-pro02.kfk.com:/opt/modules/hadoop-2.5.0/etc/hadoop/
4.判断是否配置成功

二、HDFS启动集群运行测试
Bin/hdfs namenode –format
(1).启动各个节点机器服务(bigdata-pro01.kfk.com):
1.Namenode
sbin/hadoop-daemon.sh start namenode
2.Datanode
sbin/hadoop-daemon.sh start datanode
3.Resourcemanager
sbin/yarn-daemon.sh start resourcemanager
4.Nodemanger
sbin/yarn-daemon.sh start nodemanager
5.Jobhistoryserver historyserver
mapreduce日志必须开启
./mr-jobhistory-daemon.sh start historyserver

(2).jbs查看节点

在其他主机配置DataNode、NodeManager的节点
三、YARN集群运行MapReduce程序测试
1.在目录下创建并编辑一个文件

2.判断是否创建

3.启动服务
bin/hdfs dfs -put /opt/datas/wc.input /user/kfk/data/

4.HDFS服务页面
bin/hdfs dfs -put /opt/datas/wc.input /user/kfk/data/
http://bigdata-pro01.kfk.com:50070/

5.YARN服务页面
http://bigdata-pro01.kfk.com:8088/
图为开启了两台虚拟机的服务
