Mac 部署Hadoop环境

一、安装JDK

  1. 1.8以上都可以,不想去官网下载的直接戳这里 提取码: abfb
  2. 解压JDK
  tar –zxvf jdk-8u111-linux-x64.tar.gz /Users/wyd/software
  1. 配置JDK环境变量
   vim ~/.bash_profile

文件中添加(注意看自己的安装路径)

  export JAVA_HOME= /usr/local/jdk1.8.0_111/
  export PATH=$JAVA_HOME/bin:$PATH
  1. 使用 source 命令使环境变量生效
  source ~/ .bash_profile
  1. 验证环境变量是否正确
  java -version
图片.png

二、修改主机名

  1. 修改主机名
sudo scutil --set HostName name

查看

hostname
image
  1. 配置host文件,终端输入
vim /etc/hosts
image

文件中加入

127.0.0.1 master

执行source /etc/hosts 使文件失效

source /etc/hosts
image

三、免密钥登录配置

<p>问:为何要配置免密匙登录?
<p>答:远程登录的时候需要验证,你要是不嫌麻烦每次启动hadoop集群的时候输入密码,反正我懒,所以配置下

  1. 生成私钥和公钥
ssh-keygen -t rsa

通过 ssh-keygen 命令来生成密钥对在.ssh 目录下(会有提示,回车即可)
此命令执行后,会在~/.ssh 目录下生成私钥 id_rsa 和公钥 id_rsa.pub)

  1. 将 id_rsa.pub 中的公钥信息保存到authorized_keys 中
cat id_rsa.pub >> authorized_keys
图片.png
  1. 修改文件授权
chmod 600 ./authorized_keys
图片.png

4、验证是否成功

ssh master
image

三、 Hadoop 配置部署

  1. 新建一个文件夹用来放所有关于大数据安装环境,我这里叫software,你随意开心就好。
mkdir software
图片.png
  1. 下载hadoop2.7.3安装包到software官网或者直接戳这里
提取码: e65w
  1. 解压安装包
tar -zvxf hadoop-2.7.3.tar.gz
图片.png
  1. 新建文件夹存储hadoop相关数据就叫bigdata
mkdir bigdata
  1. 此时就到修改配置文件了,进入hadoop安装目录,直接上图


    图片.png
  2. 配置环境变量 core-site.xml
执行:vim core-site.xml

把以下代码复制到 core-site.xml(注意下图中标红的地方,一定不能出错,切记!切记!切记!)

<configuration>
    <property>
        <!-- 指定 hadoop 运行时产生文件的存储路径 -->
        <name>hadoop.tmp.dir</name>
        <value>file:/usr/local/hadoop/tmp</value>
        <description>A base for other temporary directories.</description>
    </property>
    <property>
        <!-- hdfs namenode 的通信地址 -->
        <name>fs.defaultFS</name>
        <value>hdfs://master:9000</value>
    </property>
    <property>
        <name>hadoop.proxyuser.wyd.groups</name>
        <value>*</value>
    </property>
    <property>
        <name>hadoop.proxyuser.wyd.hosts</name>
        <value>*</value>
    </property>
</configuration>
image

7、配置文件系统 hdfs-site.xml(注意下图标红的地方不能出错,切记!切记)
该文件指定与 HDFS 相关的配置信息。需要修改 HDFS 默认的块的副本属性,因为 HDFS 默认情况下每个数 据块保存 3 个副本,而在伪分布式模式下运行时,由于只有一个数据节点,所以需要将副本个数改为 1;

vim hdfs-site.xml
图片.png
<configuration>
    <property>
        <!-- 指定 HDFS 存储数据的副本数目,默认情况下是 3 份-->
        <name>dfs.replication</name>
        <value>1</value>
    </property>
    <property>
        <!-- name node 存放 name table 的目录 -->
      <name>dfs.namenode.name.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/name</value>
    </property>
    <property>
        <!--datanode 存放数据 block 的目录 -->
        <name>dfs.datanode.data.dir</name>
        <value>file:/usr/local/hadoop/tmp/dfs/data</value>
    </property>
</configuration>
图片.png
  1. 配置计算框架 mapred-site.xml,指定MapReduce 作业相关的配置属性
    文件中是mapred-site.xml.template 将其重命名为 mapred-site.xml
 mv mapred-site.xml.template mapred-site.xml
 vim mapred-site.xml
 <configuration>
    <property>
        <!-- 指定 mapreduce 编程模型运行在 yarn 上 -->
        <name>mapreduce.framework.name</name>
        <value>yarn</value>
    </property>
<property>
    <name>mapreduce.jobhistory.done-dir</name>
    <value>/user/history/done</value>
</property>
<property>
    <name>mapreduce.jobhistory.intermediate-done-dir</name>
    <value>/user/history/done_intermediate</value>
</property>
<property>
    <name>mapreduce.jobhistory.address</name>
    <value>master:10020</value>
</property>
<property>
    <name>mapreduce.jobhistory.webapp.address</name>
    <value>master:19888</value>
</property>
</configuration>
image
  1. 配置文件系统 yarn-site.xml,注意下图中标红的地方,和你主机名称保持一致
vim yarn-site.xml


<configuration>
    <property>
        <!-- mapreduce 执行 shuffle 时获取数据的方式 -->
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.resourcemanager.address</name>
        <value>master:18040</value>
    </property>
    <property>
        <name>yarn.resourcemanager.scheduler.address</name>
        <value>master:18030</value>
    </property>
    <property>
        <name>yarn.resourcemanager.resource-tracker.address</name>
        <value>master:18025</value>
    </property>
    <property>
        <name>yarn.resourcemanager.admin.address</name>
        <value>master:18141</value>
    </property>
    <property>
        <name>yarn.resourcemanager.webapp.address</name>
        <value>master:18088</value>
    </property>
</configuration>
image

10、Hadoop namenode 格式化

hdfs namenode -format

看到successfully formatted" 和 "Exitting with status 0" 的提示,如果是"Exitting with status 1"则表示失败,我这里格式化了就不再操作
11、启动hadoop集群

start-all.sh

12、查看进程是否正常,是否有这几个进程
namenode、secondarynamenode、datanode、resourcemanager、nodemanager

jps

如图标红的进程,其余不用管


image

13、查看webUI是否正常
浏览其中输入

http://master:50070/

如图则表示正常:

image

到这里hadoop集群就搭建好了,如有问题欢迎指正,谢谢!

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,366评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,521评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,689评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,925评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,942评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,727评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,447评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,349评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,820评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,990评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,127评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,812评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,471评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,017评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,142评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,388评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,066评论 2 355

推荐阅读更多精彩内容

  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,754评论 0 14
  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 129,955评论 12 168
  • 前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...
    数据萌新阅读 1,457评论 1 1
  • 前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...
    __豆约翰__阅读 1,600评论 2 3
  • 前言 Hadoop在大数据技术体系中的地位至关重要,Hadoop是大数据技术的基础,对Hadoop基础知识的掌握的...
    piziyang12138阅读 1,968评论 0 3