1-Hadoop环境配置

配置

配置时间 2015年5月5日
操作系统 Mint-16,64bit
Hadoop版本 2.2.0
安装模式 单机伪分布式

步骤

  • 安装JAVA

    • 下载安装JAVA —— Open-JDK 1.7 64bit

    • 设置环境变量

    • 使用java -version命令验证JAVA安装是否成功

$ sudo vi /etc/profile

#在文件结尾添加以下四个路径
export JAVA_HOME=/usr/lib/jdk/jdk1.7.0_51

export JRE_HOME=/usr/lib/jdk/jdk1.7.0_51/jre

export PATH=$JAVA_HOME/bin:$JAVA_HOME/jre/bin:$PATH

export CLASSPATH=$CLASSPATH:.:$JAVA_HOME/lib:$JAVA_HOME/jre/lib

#更新文件内容
$ source /etc/profile
java -Version
java -Version
  • 配置SSH免密码登录
#创建RSA密钥对并复制公钥到钥匙串authorized_keys即可

$ ssh-keygen -t rsa -P "" 

$ cat .ssh/id_rsa.pub >> .ssh/authorized_keys 

$ ssh localhost
  • Hadoop下载
$ wget https://archive.apache.org/dist/hadoop/core/hadoop-2.2.0/hadoop-2.2.0.tar.gz 

$ tar -xvzf hadoop-2.2.0.tar.gz

$ sudo mv hadoop-2.2.0/ /usr/

$ chmod 777 -R hadoop-2.2.0/
  • Hadoop配置
$ cd /usr/hadoop-2.2.0/etc/hadoop

hadoop-env.sh yarn-env.sh 添加JDK路径

$ vi hadoop-env.sh
export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-amd64

$ vi yarn-env.sh
export JAVA_HOME=/usr/lib/jvm/java-1.7.0-openjdk-amd64

hdfs-site.xml HDFS配置

<configuration>
    <property>
        <name>dfs.namenode.name.dir</name>
        <value>file:/home/zhy/hdfs/name</value>
        <final>true</final>
    </property>
    <property>
        <name>dfs.datanode.data.dir</name>
        <value>file:/home/zhy/hdfs/data</value>
        <final>true</final>
    </property>  
    <property>
        <name>dfs.permissions</name>
        <value>false</value>
    </property>
    <property>
        <name>dfs.replication</name>
        <value>1</value>
    </property>
</configuration>

core-site.xml 配置Namenode

<configuration>
<property>
    <name>fs.default.name</name>
    <value>hdfs://node:8020</value>
    <final>true</final>
</property>
</configuration>

mapred-site.xml MapReduce设置

<configuration>
    <property>  
        <name>mapreduce.framework.name</name>  
        <value>yarn</value>  
    </property>  

    <property>  
        <name>mapred.system.dir</name>  
        <value>file:/home/zhy/hadoop/mapred/system</value>  
        <final>true</final>  
    </property>  

    <property>  
        <name>mapred.local.dir</name>  
        <value>file:/home/zhy/hadoop/mapred/local</value>  
        <final>true</final>  
    </property>
</configuration>

yarn-site.xml Yarn资源管理配置

<configuration>
    <property>
        <name>yarn.nodemanager.aux-services</name>
        <value>mapreduce_shuffle</value>
    </property>
    <property>
        <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
        <value>org.apache.hadoop.mapred.ShuffleHandler</value>
    </property>
</configuration>

slaves保存所有slave节点的主机名或IP地址;
/etc/hostname 保证主机名和其他节点中主机名一致;
/etc/hosts 主机名和IP地址的映射关系,这里只需要添加本机

$ vi slaves
node

$ vi /etc/hosts
node 172.20.10.6

  • 验证Hadoop安装配置

格式化Namenode

hdfs namenode -format

启动HDFS和Yarn

$ cd /usr/hadoop-2.2.0/sbin/

$ ./hadoop-daemon.sh start namenode

$ ./hadoop-daemon.sh start datanode

$ ./yarn-daemon.sh  start resourcemanager

$ ./yarn-daemon.sh  start nodemanager

#简单命令启动
$ ./start-dfs.sh

$ ./start-yarn.sh

#简单但废弃的启动命令
$ ./start-all.sh

使用jps查看进程启动是否成功

 $ jps
jps 命令结果

操作检验

$ hdfs dfs -ls /

$ hdfs dfs -mkdir  /home
 
$ hdfs dfs -put /usr/hadoop-2.2.0/LICENSE.txt  /home/hadoop/

其他操作

  • 关闭Hadoop
$ cd /usr/hadoop-2.2.0/sbin/

$ ./stop-yarn.sh

$ ./stop-dfs.sh

问题及解决方案

  • Warning

出现这个警告是由于Hadoop的库文件是在32bit环境下编译的,解决方式是下载对应版本的Hadoop源码,并在本机器上编译即可,该警告不影响Hadoop功能。

  • could only be replicated to 0 nodes error

出现这个问题可能是由于DataNode连接问题,尝试以下两个操作:

1 编辑**/etc/hosts**文件并将配置中使用的主机名IP地址写入该文件

2 删除Hadoop的**tmp**文件夹,尝试重启并格式化Namenode
  • path is not a file error

这个问题在该URL中提出过,这也是我解决这个问题的思路。是由于把输入文件放在了/tmp路径下,导致中间结果也被当做输入读取,且Hadoop无法读取多层目录的输入,因此出错。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,362评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,330评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,247评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,560评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,580评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,569评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,929评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,587评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,840评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,596评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,678评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,366评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,945评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,929评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,165评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,271评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,403评论 2 342

推荐阅读更多精彩内容

  • 简述 hadoop 集群一共有4种部署模式,详见《hadoop 生态圈介绍》。HA联邦模式解决了单纯HA模式的性能...
    mtide阅读 12,684评论 8 20
  • 看到题目有没有一种高大上的感觉?毛线,当前是个人、是个公司都在说自己搞大数据,每天没有几个PB的数据入库,每天没有...
    丁小晶的晶小丁阅读 4,441评论 0 50
  • 之前的有点忘记了,这里在云笔记拿出来再玩玩.看不懂的可以留言 大家可以尝试下Ambari来配置Hadoop的相关环...
    HT_Jonson阅读 2,938评论 0 50
  • 心静下来,很多无意识不觉察的事便会漫漫袭来,原来可以那么的美好! 企业培训师,喜画画,乐诗文。
    世伟观世阅读 386评论 4 6
  • . 1个字符。? 可能没有,也可能有一个。0或1个字符。 任意个前面的字符。0到*。 至少一个,没有?给你加一个。...
    历奇阅读 349评论 0 0