【hadoop-部署】Hadoop2.x HA集群搭建

一、安装环境准备

操作系统：centos7
三台主机
hdc-data4：192.168.163.54
hdc-data5：192.168.163.55
hdc-data6：192.168.163.56
【安装环境准备每台集群机器一样的操作，或者使用scp远程拷贝】

0、创建新的虚拟机【可选】

根据安装向导创建一台虚拟机主机(其他主机使用克隆)。然后配置静态ip和主机名。重启网络服务。
step1: 配置IP

vi /etc/sysconfig/network-scripts/ofcfg-ens33

image.png

step2: 修改主机名

vi /etc/hostname

step3: 使用 init 6命令重启主机，使用ip addr查看ip

image.png

step4: 克隆主机
当前主机关机，选择虚拟机 ->管理->克隆。克隆完成修改IP和主机名重启即可。

第三步时选择【创建完整克隆(F)】

image.png

1、主机名IP映射配置

vi /etc/hosts
#添加如下地址映射
192.168.163.54 hdc-data4
192.168.163.55 hdc-data5
192.168.163.56 hdc-data6

2、SSH免密登录配置

ssh-keygen
ssh-copy-id -i ~/.ssh/id_rsa.pub root@hdc-data4
ssh-copy-id -i ~/.ssh/id_rsa.pub root@hdc-data5
ssh-copy-id -i ~/.ssh/id_rsa.pub root@hdc-data6

image.png

3、关闭及禁止防火墙

systemctl stop firewalld.service
systemctl disable firewalld.service

4、关闭SELinux

SELinux(Security-Enhanced Linux) 是美国国家安全局（NSA）对于强制访问控制的实现，是 Linux历史上最杰出的新安全子系统。NSA是在Linux社区的帮助下开发了一种访问控制体系，在这种访问控制体系的限制下，进程只能访问那些在他的任务中所需要文件。

vi /etc/sysconfig/selinux
#修改以下内容
SELINUX=disabled

image.png

5、开启NTP服务

yum install -y ntp
systemctl enable ntpd 
systemctl start ntpd

6、安装JDK

下载地址：https://www.oracle.com/technetwork/cn/java/javase/downloads/jdk8-downloads-2133151-zhs.html

mkdir -p /opt/java
tar -zxvf jdk-8u181-linux-x64.tar.gz -C /opt/java/
vi /etc/profile

export JAVA_HOME=/opt/java/jdk1.8.0_181
export JRE_HOME=$JAVA_HOME/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib
export PATH=$PATH:$JAVA_HOME/bin

远程分发到其他服务器

scp -r /opt/java/jdk1.8.0_181/ root@hdc-data5:/opt/java/
scp -r /opt/java/jdk1.8.0_181/ root@hdc-data6:/opt/java/

scp /etc/profile root@hdc-data5:/etc/
scp /etc/profile root@hdc-data6:/etc/

source /etc/profile

二、安装zookeeper

mkdir -p /opt/apps
tar -zxvf zookeeper-3.4.6.tar.gz -C /opt/
mkdir -p /data/zookeeper/data
mkdir -p /data/zookeeper/log

#每台机器myid不能相同，1,2,3...以此类推
echo 1 > /data/zookeeper/data/myid

vi /opt/zookeeper-3.4.6/conf/zoo.cfg

zoo.cfg

tickTime=2000
initLimit=10
syncLimit=5
dataDir=/data/zookeeper/data
dataLogDir=/data/zookeeper/log
clientPort=2181
server.1=hdc-data4:2888:3888
server.2=hdc-data5:2888:3888
server.3=hdc-data6:2888:3888

ln -s /opt/zookeeper-3.4.6/ /opt/apps/zookeeper
vi /etc/profile

/etc/profile

export ZOOKEEPER_HOME=/opt/apps/zookeeper
export PATH=$PATH:$ZOOKEEPER_HOME/bin

三、安装hadoop

1、下载解压hadoop

tar -zxvf hadoop-2.7.2.tar.gz -C /opt
ln -s /opt/hadoop-2.7.2/ /opt/apps/hadoop
vi /etc/profile

/etc/profile

export HADOOP_HOME=/opt/apps/hadoop
export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

2、修改hadoop配置文件

需要修改/opt/hadoop-2.7.2/etc/hadoop/下hadoop-env.sh、core-site.xml、hdfs-site.xm、yarn-site.xml、mapred-site.xml、slaves

cd /opt/hadoop-2.7.2/etc/hadoop/
mv mapred-site.xml.template mapred-site.xml

hadoop-env.sh

export JAVA_HOME=/opt/java/jdk1.8.0_181 --第25行

core-site.xml

<!-- 指定hdfs的nameservice为mycluster -->
<property>
    <name>fs.defaultFS</name>
    <value>hdfs://mycluster</value>
</property>

<!--指定zookeeper地址-->
<property>
    <name>ha.zookeeper.quorum</name>
    <value>hdc-data4:2181,hdc-data5:2181,hdc-data6:2181</value>
</property>

<!--指定hadoop数据临时存放目录-->
<property>
    <name>hadoop.tmp.dir</name>
    <value>/data/hadoop</value>
</property>

hdfs-site.xml

<!--指定hdfs的nameservice为mycluster，需要和core-site.xml中的保持一致 -->
<property>
    <name>dfs.nameservices</name>
    <value>mycluster</value>
</property>

<!-- mycluster下面有两个NameNode，分别是nn1，nn2 -->
<property>
    <name>dfs.ha.namenodes.mycluster</name>
    <value>nn1,nn2</value>
</property>

<!-- nn1的RPC通信地址 -->
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn1</name>
    <value>hdc-data4:8020</value>
</property>

<!-- nn2的RPC通信地址 -->
<property>
    <name>dfs.namenode.rpc-address.mycluster.nn2</name>
    <value>hdc-data5:8020</value>
</property>

<!-- nn1的http通信地址 -->
<property>
    <name>dfs.namenode.http-address.mycluster.nn1</name>
    <value>hdc-data4:50070</value>
</property>

<!-- nn2的http通信地址 -->
<property>
    <name>dfs.namenode.http-address.mycluster.nn2</name>
    <value>hdc-data5:50070</value>
</property>

<!-- 指定NameNode的元数据在JournalNode上的存放位置 -->
<property>
    <name>dfs.namenode.shared.edits.dir</name>
    <value>qjournal://hdc-data4:8485;hdc-data5:8485;hdc-data6:8485/mycluster</value>
</property>

<!-- 开启NameNode故障时自动切换 -->
<property>
    <name>dfs.ha.automatic-failover.enabled</name>
    <value>true</value>
</property>

<!-- 配置失败自动切换实现方式 -->
<property>
    <name>dfs.client.failover.proxy.provider.mycluster</name>
    <value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>
</property>

<!-- 配置隔离机制，如果ssh是默认22端口，value直接写sshfence即可,否则sshfence(host:port)  -->
<property>
    <name>dfs.ha.fencing.methods</name>
    <value>sshfence</value>
</property>

<!-- 使用隔离机制时需要ssh免登陆 -->
<property>
    <name>dfs.ha.fencing.ssh.private-key-files</name>
    <value>/root/.ssh/id_rsa</value>
</property>

<!-- 指定JournalNode在本地磁盘存放数据的位置 -->
<property>
    <name>dfs.journalnode.edits.dir</name>
    <value>/data/hadoop/journalnode</value>
</property>

yarn-site.xml

<!-- 指定YARN的老大（ResourceManager）的地址 -->
<property>
    <name>yarn.resourcemanager.hostname</name> 
    <value>hdc-data4</value>
</property>

<!-- reducer获取数据的方式 -->
<property>
    <name>yarn.nodemanager.aux-services</name> 
    <value>mapreduce_shuffle</value>
</property>

mapred-site.xml

<!-- 指定mr运行在yarn上 -->
<property>
    <name>mapreduce.framework.name</name> 
    <value>yarn</value>
</property>

slaves

hdc-data4
hdc-data5
hdc-data6

3、同步到集群其他主机

拷贝/etc/profile文件和zookeeper、hadoop目录（保持集群hadoop配置文件一致）

scp /etc/profile root@hdc-data5:/etc/
scp /etc/profile root@hdc-data6:/etc/

scp -r /opt/zookeeper-3.4.6 root@hdc-data5:/opt/
scp -r /opt/zookeeper-3.4.6 root@hdc-data6:/opt/

scp -r /opt/hadoop-2.7.2 root@hdc-data5:/opt/
scp -r /opt/hadoop-2.7.2 root@hdc-data6:/opt/

并在被同步的主机建立软连接

ln -s /opt/zookeeper-3.4.6/ /opt/apps/zookeeper
ln -s /opt/hadoop-2.7.2/ /opt/apps/hadoop

注：若被同步主机未执行 echo [1,2,3...] > /data/zookeeper/data/myid分配zookeeper id，则需要分配唯一的id。
每台集群服务器执行 source /etc/profile使得环境变量生效

4、启动及初始化（严格按照下面步骤执行）

1> 在三个节点上执行如下命令启动zookeeper，并分别查看节点状态，正常情况下一个leader和两个follower。

zkServer.sh start
zkServer.sh status

2> hdc-data4(master)节点上启动journalnode集群。用jps检验集群节点多了JournalNode进程。

hadoop-daemons.sh start journalnode

3>hdc-data4(master)上格式化HDFS

hdfs namenode -format

4>保持主从master历史日志一致

scp -r /data/hadoop/dfs/name root@hdc-data5:/data/hadoop/dfs/

5>hdc-data4(master)上格式化ZK

hdfs zkfc -formatZK

6>hdc-data4(master)上启动HDFS和YARN

start-all.sh

7>jsp查看启动进程是否正常，并通过50070和8088端口在WEBUI查看。

image.png

最后编辑于：2018.12.07 22:54:41

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 216,287评论 6赞 498
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 92,346评论 3赞 392
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 162,277评论 0赞 353
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,132评论 1赞 292
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,147评论 6赞 388
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,106评论 1赞 295
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,019评论 3赞 417
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 38,862评论 0赞 274
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,301评论 1赞 310
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,521评论 2赞 332
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,682评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,405评论 5赞 343
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 40,996评论 3赞 325
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,651评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,803评论 1赞 268
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 47,674评论 2赞 368
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,563评论 2赞 352

【hadoop-部署】Hadoop2.x HA集群搭建

一、安装环境准备

0、创建新的虚拟机【可选】

1、主机名IP映射配置

2、SSH免密登录配置

3、关闭及禁止防火墙

4、关闭SELinux

5、开启NTP服务

6、安装JDK

二、安装zookeeper

三、安装hadoop

1、下载解压hadoop

2、修改hadoop配置文件

3、同步到集群其他主机

4、启动及初始化（严格按照下面步骤执行）

推荐阅读更多精彩内容