hadoop平台搭建（1）

介绍：在Linux系统上安装分布式hadoop平台，副本数为2；

架构:centos6.5+ hadoop2.6.5+jdk1.8

配置：此次配置的用户为hadoop用户（无注明的步骤中均使用hadoop用户，防止权限过大，误操作影响系统安全)

master IP:192.168.125.201

slave1 IP:192.168.125.202

slave2 IP:192.168.125.203

安装步骤：

一、windows10下进行安装包下载：

1、下载安装包 jdk1.8(64位的系统需要装 64位的安装包)

http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

2、下载安装包 hadoop2.6.5(64位的系统需要装 64位的安装包)

http://archive.apache.org/dist/hadoop/common/hadoop-2.6.5/

二、对linux系统进行配置（先配置master,salve直接克隆master)：

1、创建/soft文件夹，存放应用程序(root用户)

sudo mkdir /soft

sudo chown hadoop:hadoop /soft

2、使用 rz,把windows下文件传到linux下

由于没有安装 rz,sz 包，无法使用命令，重新下载 rz,sz包

https://ohse.de/uwe/software/lrzsz.html

3、将两个文件放到 /soft目录下

4、配置sudo（root用户配置）

----临时借用root的权限执行命令，需要配置当前用户具有sudo的执行权利

vim /etc/sudoers

hadoop ALL =(ALL) ALL

关闭内核防火墙：

vim /etc/selinux/config

SELINUX=disabled

关闭防火墙：

systemctl stop firewalld.service

systemctl disable firewalld.service

5、先对master进行配置:

配置IP(root用户)：

vim /etc/sysconfig/network-scripts/ifcfg-eth0

IPADDR=192.168.125.201

NETMASK=255.255.255.0

GATEWAY=192.168.125.1

DNS=192.168.125.1

配置主机名(root用户)：

vim /etc/hosts

192.168.125.201 master

192.168.125.202 slave1

192.168.125.203 slave2

vim /etc/sysconfig/network

HOSTNAME=master

6、安装jdk包 (root用户,由于其他用户或者其他程序会用到JDK，所以JDK使用root用户进行安装，且目录为/usr/local/src）

1）解压(root用户)

cp /soft/jdk-8u191-linux-x64.tar.gz /usr/local/src/

cd /usr/local/src/

tar -zxvf jdk-8u191-linux-x64.tar.gz

2)配置环境变量(root用户)；

vim ~/.bashrc #对root用户生效

export JAVA_HOME=/usr/local/src/jdk1.8.0_172

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:$PATH

source ~/.bashrc (root用户)

vim /etc/profile #对所有用户生效 (root用户)

export JAVA_HOME=/usr/local/src/jdk1.8.0_172

export JRE_HOME=${JAVA_HOME}/jre

export CLASSPATH=.:${JAVA_HOME}/lib:${JRE_HOME}/lib

export PATH=${JAVA_HOME}/bin:$PATH

source /etc/profile (root用户)

7、安装hadoop

tar -zxvf hadoop-2.7.2.tar.gz -C /soft/

8、创建符号链接，方便读取：

ln -s /soft/hadoop-2.7.2/ /soft/hadoop

9、配置HADOOP环境变量：

vim ~/.bashrc

export HADOOP_HOME=/soft/hadoop

export PATH=$PATH:$HADOOP_HOME/bin:$HADOOP_HOME/sbin

source ~/.bashrc

10.对hadoop文件进行配置：

1）cd hadoop-2.6.5/etc/hadoop/

vim hadoop-env.sh

export JAVA_HOME=/usr/local/src/jdk1.8.0_172

2）vim yarn-env.sh

export JAVA_HOME=/usr/local/src/jdk1.8.0_172

3）修改配置文件添加从节点主机名

vim slaves

slave1

slave2

4）vim core-site.xml

<name>fs.defaultFS</name> #指定文件系统master

<value>hdfs://master</value>

</property>

<name>hadoop.tmp.dir</name> #指定节点的文件路径存放位置

<value>/soft/hadoop/tmp</value>

</property>

</configuration>

5）hdfs-site.xml

<name>dfs.namenode.secondary.http-address</name> #指定辅助名称节点位置

<value>master:9001</value>

</property>

<name>dfs.namenode.name.dir</name> #指定名称节点的文件路径

<value>file://${hadoop.tmp.dir}/dfs/name</value>

</property>

<name>dfs.datanode.data.dir</name> #指定数据节点的文件路径

<value>file://${hadoop.tmp.dir}/dfs/data</value>

</property>

<name>dfs.replication</name> #指定副本个数

</property>

6） vim mapred-site.xml

<name>mapreduce.framework.name</name> #使用yarn运行mapreduce程序

</property>

7) vim yarn-site.xml ##资源管理器节点--配置各种地址

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>

<value>org.apache.hadoop.mapred.ShuffleHandler</value>

</property>

<name>yarn.resourcemanager.address</name>

<value>master:8032</value>

</property>

<name>yarn.resourcemanager.scheduler.address</name>

<value>master:8030</value>

</property>

<name>yarn.resourcemanager.resource-tracker.address</name>

<value>master:8035</value>

</property>

<name>yarn.resourcemanager.admin.address</name>

<value>master:8033</value>

</property>

<name>yarn.resourcemanager.webapp.address</name>

<value>master:8088</value>

</property>

8）创建上述配置的文件存放目录

mkdir /soft/hadoop/tmp

mkdir -p /soft/hadoop/tmp/dfs/data

mkdir -p /soft/hadoop/tmp/dfs/name

三、其他配置

1、虚拟机中克隆master 两台，作为slave1,slave2;

2、修改slave1,slave2的IP(root用户)：

slave1:

IPADDR=192.168.125.202

slave2:

IPADDR=192.168.125.203

service network restart

修改主机名

slave1:

vim /etc/sysconfig/network

HOSTNAME=slave1

slave2:

vim /etc/sysconfig/network

HOSTNAME=slave2

3、配置免密登录:

配置ssh免密码登录(三台机器都安装)

192.168.125.201先配置密钥：

ssh-keygen -t rsa -P '' -f ~/.ssh/id_rsa

cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

chmod 0600 ~/.ssh/authorized_keys

传送到slave上去(无法操作的需要重启一次）

scp ~/.ssh/authorized_keys hadoop@slave1:~/.ssh/authorized_keys

scp ~/.ssh/authorized_keys hadoop@slave2:~/.ssh/authorized_keys

ssh进行测试 :

ssh slave1

ssh slave2

4、配置windows的Hosts名，方便主机名访问hadoop平台

网页控制台（需要修改本地hosts文件添加主机记录）

# Windows C:\Windows\System32\drivers\etc\hosts #没有可以新建文件

192.168.125.201 master

192.168.125.202 slave1

192.168.125.203 slave2

四、初始化节点与启动集群：

hadoop namenode -format

启动集群：/usr/local/src/hadoop-2.6.5/sbin/start-all.sh

查看进程：jps

浏览器访问 http://master:8088/cluster

----------------------------------------------

五：master增加两个脚本，用来同步文件和查看进程状态

创建好文件后，给予可执行命令，并将脚本放到/soft/hadoop/sbin/ 下

此时需要将java_home放到hadoop用户的.bashrc 配置文件中;

同步脚本：

xsync.sh

#!/bin/bash

if [[ $# -lt 1 ]] ; then echo no params ; exit ; fi

##当传入文件传入时，通过取到文件的名，文件路径，然后用xsync同步到对应的slave路径下

p=$1 #传入的文件名，可带路径

#echo p=$p #文件名字

dir=`dirname $p` ##取文件文件夹路径

#echo dir=$dir

filename=`basename $p` ##文件去掉路径后的文件名

#echo filename=$filename

cd $dir #到文件的所处路径

fullpath=`pwd -P .` #找到当前位置

#echo fullpath=$fullpath

user=`whoami`

for (( i = 1 ; i <= 2 ; i = $i + 1 )) ; do

echo ======= slave$i =======

rsync -lr $p ${user}@slave$i:$fullpath

done ;

查看文件和进程；

xcall.sh

#!/bin/bash

params=$@

echo ============= master $params =============

ssh master "$params"

echo ============= slave1 $params=============

ssh slave1 "$params"

echo ============= slave2 $params=============

ssh slave2 "$params"

效果：

最后编辑于：2020.03.12 18:34:36

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,753评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,668评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 166,090评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 59,010评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 68,054评论 6赞 395
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,806评论 1赞 308
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,484评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,380评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,873评论 1赞 319
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,021评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,158评论 1赞 352
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,838评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,499评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,044评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,159评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,449评论 3赞 374
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,136评论 2赞 356

hadoop平台搭建（1）

推荐阅读更多精彩内容