hadoop学习笔记(二):伪分布式安装及数据测试

提前准备:

1、配置网络(包括主机名、虚拟机名)。修改的文件有/etc/hosts 、/etc/sysconfig/network-scripts/ifcg-eth0

2、设置SSH免密码登陆。

虚拟机上执行 :# ssh  主机ip

输入主机密码

# ssh-keygen -t rsa   /*生成密钥*/

# ssh-copy-id  主机ip

ssh 主机ip      /*测试虚拟机免密码登陆主机*/

3、主机安装jdk(先下载所需要的jdk)

(1)先检查是否安装jdk

rpm -qa|grep jdk

(2)   查看jdk版本

java -version

(3)删除所有安装的jdk

yum -y remove jdk {jdk-openss..}

(4)解压,安装

tar -zxvf {jdk.1.7.0...*.tar.gz} -C 安装路径

(5)修改配置文件。/etc/profile

最后加入

(5)查看是否安装成功

java -version

4、创建存放所需软件的文件夹,如opt下创建softwares、data

mkdir /opt/sosftwares

mkdir /opt/data

伪分布式安装hadoop:

requirements:-------->所有都在hadoop-1.7.1-src-->BUILDING.txt文件里

(1) 点击这里下载hadoop版本/**下载到/opt/softwares目录,我选择hadoop-2.7.1版本;另外,一般官网提供已经编译好的hadoop(适合32位系统的),而我要的是64位的,所以下载源码自己编译安装**/

(2)除此以外还需要以下依赖,用yum 安装这些依赖:

yum install autoconf automake libtool cmake ncurses-devel lzo-devel zlib-devel openssl-devel

(3)下载这些必备软件:

下面正式安装****

1、解压各种 #  tar -zxvf hadoop-2.7.1-src.tar.gz -C /opt/softwares

# tar -zxvf findbugs-1.3.9.tar.gz -C /opt/softwares

#  tar -zxvf apache-maven-3.0.5-bin.tar.gz -C /opt/softwares

# tar -zxvf protobuf-2.5.0.tar.gz -C /opt/softwares

2、安装maven,findbugs

#cd  /opt/softwares/apache-maven-3.0.5

查看maven安装路径:# pwd

修改环境变量:#vim /etc/profile

export  MAVEN_HOME=/opt/softwares/apache-maven-3.0.5

export PATH=$MAVEN_HOME/bin

使配置生效:source /etc/profile

查看是否安装成功: mvn -v

同理,安装findbugs....(查看findbugs安装成功? findbugs -version)

/etc/profile环境配置

3、安装protobuf

# cd protobuf-2.5.0

# ./configure

# make install

4、编译hadoop-src源码

#cd hadoop-2.7.1-src

编译#  mvn package -Pdist,native -DskipTests -Dtar

5、安装hadoop,配置文件修改环境变量 。

#cd hadoop-2.7.1

# vim /etc/hadoop/hadoop-env.sh   ,打开加入 export JAVA_HOME=/usr/java/latest,如下:

启动hadoop   #  bin/hadoop

6、修改etc/hadoop/core-site.xml文件

# vim etc/hadoop/core-site.xml

hadoop1.x版本端口号9000;2.x版本也可以是8020

其中,/data/tmp目录是自己创建的,需要手动创建:mkdir data;  mkdir tmp

7、修改etc/hadoop/hdfs-site.xml文件

注意:因为是伪分布式安装,所以副本数为1,如果集群安装,副本就有3份!!

接下来,如果想本地执行MapReduce,则按照8---10步骤;

如果想在YARN(主要资源调度)上执行MapReduce,则按照8(1)-----10(1)步骤;

8、格式化hdfs

# cd hadoop-2.7.1

# bin/hadoop    /***查看hdfs帮助文档,学习hadoop命令操作**/

格式化 #bin/hdfs namenode -format

9、启动HDFS,即有NameNode和DataNode

#     sbin/start-dfs.sh

10、查看进程是否启动成功

#  jps  /******/

8(1)、配置文件 etc/hadoop/mapred-site.xml

# cd  hadoop-2.7.1

#  vim etc/hadoop/mapred-site.xml

9(1)、配置文件etc/hadoop/yarn-site.xml

10(1)、# sbin/start-yarn.sh

查看资源管理监控  http://localhost:8088/      /**同样,localhost替换成主机名***/

11、通过日志监控界面查看信息

http://localhost:50070/                /***localhost是默认值,可以设置为自己的主机名***/

安装至此完成!!

wordcount数据测试:

1、# cd  /opt/data

# touch words

# vim words

words为input文件

2、将文件上传到hdfs中

#  bin/hadoop fs -help

#  bin/hadoop fs -put /opt/data/words /words

已上传成功

3、wordcount   (首先对数据进行分片处理,然后生成Job)

# bin/hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.1.jar wordcount /words /out

4、查看输出结果

# bin/hadoop fs -ls /

# bin/hadoop fs -ls /out

# bin/hadoop fs -cat /out/part-r-00000

very nice!!终于可以了.....好想哭!!刚刚简书把我保存的笔记链接访问不到了,吓死宝宝了!!

附上官方Apache Hadoop2.7.1安装手册

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,794评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,050评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,587评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,861评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,901评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,898评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,832评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,617评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,077评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,349评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,483评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,199评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,824评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,442评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,632评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,474评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,393评论 2 352

推荐阅读更多精彩内容