<转载>HDFS伪分布式及全分布式的搭建

http://hadoop.apache.org/docs/r3.1.3/hadoop-project-dist/hadoop-common/ClusterSetup.html

概述:
利用多台Linux主机来进行部署Hadoop,对Linux机器集群进行规划,使得Hadoop各个模块分别部署在不同的多台机器上。

新建一个虚拟机hadoop1为主站,分别克隆名为hadoop2、hadoop3、hadoop4的从站。

centOS 7 安装 :https://blog.csdn.net/Henry_Lin_Wind/article/details/80876494

添加主机名与ip地址的映射关系,有两处:
更改 /etc/hosts
使用火绒-安全工具更改windows的hosts
Hostname IP
hadoop1 192.168.100.128
hadoop2 192.168.100.129
hadoop3 192.168.100.130
hadoop4 192.168.100.131
重启生效

服务器功能规划:分别在3台主机上安装不同的功能
hadoop1 hadoop2 hadoop3 hadoop4
NameNode ResourceManage
DataNode DataNode DataNode DataNode
NodeManager NodeManager NodeManager NodeManager
HistoryServer SecondaryNameNode

安装步骤:
1、安装虚拟机,设置网络
安装vmware-tools: yum install -y open-vm-tools
更改ip vim /etc/sysconfig/network-scripts/ifcfg-ens33
更改 BOOTPROTO=static
ONBOOT=yes
e.g. IPADDR=192.168.100.128
GATEWAY=192.168.100.2
NETMASK=255.255.255.0
DNS1=114.114.114.114
DNS2=8.8.8.8
重启网络服务 systemctl restart network.service
2、在主站上安装好java和hadoop,
3、关闭防火墙 systemctl stop firewalld
查看:systemctl status firewalld
禁止开机启动:systemctl disable firewalld
如果安装了iptables-service。 查看 service iptables status
关闭 service iptables stop
永久关闭SELinux vim /etc/selinux/confi
修改 SELINUX=disabled 重启生效
4、配置hadoop-env.sh、core-site.xml、hdfs-site.xml、workers
5、分别在三台主机上设置SSH无密码登录
6、分发主站的hadoop和java到两个从站上
7:启动集群,查看三台主机的进程。

完全分布式安装
1、设置虚拟机网络
新增NAT模式,修改子网IP为192.168.100.0
修改NAT设置
更改 /etc/hosts
使用火绒-安全工具更改windows的hosts
2、安装Linux系统 hadoop1,拍照并克隆。克隆后更改hostname
e.g. hostnamectl set-hostname hadoop2
3、在主站安装Java 和 Hadoop (主站配置好后,最后通过分发复制到其他从站)
e.g. scp -r hadoop hadoop2:/usr/local
3.安装和配置JDK、hadoop
修改/etc/profile
JAVA_HOME=/usr/local/jdk1.8.0_141
CLASSPATH=.:JAVA_HOME/lib.tools.jar HADOOP_HOME=/usr/local/hadoop-3.1.3 PATH=JAVA_HOME/bin:PATH/bin:HADOOP_HOME/bin
export JAVA_HOME CLASSPATH PATH HADOOP_HOME
使用source profile
4、配置Hadoop JDK路径修改hadoop-env.sh、mapred-env.sh、yarn-env.sh文件中的JDK路径:
增加 export JAVA_HOME=/usr/local/jdk1.8.0_141
export HDFS_NAMENODE_USER=root
export HDFS_DATANODE_USER=root
export HDFS_SECONDARYNAMENODE_USER=root ;
5、配置core-site.xml
增加
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://hadoop1:9820</value> (需确保windows的hosts已更改)
</property>
<property>
<name>hadoop.tmp.dir</name>
<value>/usr/local/hadoop-3.1.3/data/full</value>(全分布式用full。伪分布式用tmp。)
</property>
</configuration>
fs.defaultFS为NameNode的地址。
hadoop.tmp.dir为hadoop临时目录的地址,默认情况下,NameNode和DataNode的数据文件都会存在这个目录下的对应子目录下。如需重新初始化,应先rm -rf data 删除,以防clusterID出现混乱,致使DataNode无法加载。

6、配置hdfs-site.xml
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>hadoop2:9868</value>(全分布式是hadoop2,伪分布式是1独角戏。)
</property>
<property>
<name>dfs.replication</name>
<value>2</value> (全分布式是2及以上。伪分布式是1。)
</property>
dfs.namenode.secondary.http-address是指定secondaryNameNode的http访问地址和端口号,因为在规划中,我们将hadoop2规划为SecondaryNameNode服务器。

7、配置workers
vim etc/hadoop/workers
hadoop2
hadoop3
hadoop4
(全分布式如上。伪分布式是只有hadoop1.)

10、设置SSH无密码登录

在hadoop1上生成公钥,不断回车即可。

ssh-keygen -t rsa

在hadoop1分发公钥,分别分发给三台主机。(如下,操作中需要回复yes确认以及登录密码)

ssh-copy-id hadoop1
ssh-copy-id hadoop2
ssh-copy-id hadoop3
同样的在hadoop2、hadoop3上生成公钥和私钥后,将公钥分发到三台机器上。

启动集群

1、在主站格式化NameNode
${HADOOP_HOME}/bin/hdfs namenode –format
注意:
如果需要重新格式化NameNode,需要先将原来NameNode和DataNode下的文件全部删除,不然会报错,NameNode和DataNode所在目录是在core-site.xml中hadoop.tmp.dir、dfs.namenode.name.dir、dfs.datanode.data.dir属性配置的。

2、在hadoop1上启动HDFS
${HADOOP_HOME}/sbin/start-dfs.sh
查看进程启动情况:jps
查看端口占用情况: ss -nal
关闭HDFS:/sbin/stop-dfs.sh

5、 查看HDFS Web页面
根据规划,我们部署在主站,所以访问路径为 //hadoop1:9870

测试

1、 创建测试用的Input文件
{HADOOP_HOME}/bin/hdfs dfs -mkdir /temper 2、上传一个测试文件到input文件夹{HADOOP_HOME}/bin/hdfs dfs -put *.xml /temper

————————————————
版权声明:本文为CSDN博主「Henry_Lin_Wind」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/Henry_Lin_Wind/article/details/89402422

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,607评论 6 507
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,239评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,960评论 0 355
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,750评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,764评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,604评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,347评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,253评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,702评论 1 315
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,893评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,015评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,734评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,352评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,934评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,052评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,216评论 3 371
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,969评论 2 355