2018-11-20 在Ubuntu 18中进行Hadoop伪分布式安装

我PC上是win10和Ubuntu18.0.4双系统
hadoop 2.8.5
jdk 1.8

1.安装配置jdk

从orcle官网上下载jdk,解压复制到/usr/local/下
/usr/local/jdk1.8中的文件


2018-11-20 15-48-11屏幕截图.png

修改配置文件 ~/.bashrc或 /etc/profile,添加环境变量
添加以下内容:


2018-11-20 16-01-37屏幕截图.png

报找不到路径的错误,就看看JAVE_HOME,这个一定是jdk的绝对路径。

配置完成过后,source /etc/profile,可以使修改立即生效,不用重启。
命令java -version查看是否修改成功


2018-11-20 15-56-28屏幕截图.png

2.安装配置hadoop

(1)
去Apache官网下载hadoop 2.8.5


2018-11-20 16-06-28屏幕截图.png

下载tar文件,解压后复制到/usr/local/下,改名为hadoop,目录中文件

2018-11-20 16-09-56屏幕截图.png

添加环境变量,


2018-11-20 16-13-18屏幕截图.png

注意:sbin目录下有运行hadoop守护进程的脚本,因此如果计划在本地机器上运行守护进程的话,需要将该目录包含进命令行路径中。
HADOOP_HOME一定是hadoop的绝对路径,
HADOOP_CONF_DIR指向/usr/local/hadoop/etc/hadoop
其他暂时不明,好像不写也没关系。
进入/usr/local/hadoop/etc/hadoop
sudo vim hadoop-env.sh 添加jdk路径和HADOOP_CON_DIR

输入 hadoop version来判断Hadoop是否工作

2018-11-20 16-18-37屏幕截图.png

如果报错Could not find or load main class org.apache.hadoop.util.VersionInfo
试试在配置文件中添加
export HADOOP_CLASSPATH=
(cygpath -pw
(hadoop classpath)):$HADOOP_CLASSPATH

各种奇奇怪怪的报错大多和路径有关。
(2)
修改/usr/local/hadoop/etc/hadoop/hadoop-env.sh
EXPORT JAVA_HOME=jdk的路径
Hadoop有以下三种运行模式:
1.独立(本地)模式:无需运行任何守护进程,所有程序都在同一个JVM上执行。在独立模式下测试和调试MapReduce程序很方便,因此该模式在开发阶段较合适。
2.伪分布模式: Hadoop守护进程运行在本地机器上,模拟一个小规模的集群。
3.全分布模式 :Hadoop守护进程运行在一个集群上。

不同模式的关键配置属性,等日后完善。

独立模式下,全为默认属性,不运行守护进程,不需要更多的操作配置
伪分布模式
在/usr/local/hadoop/etc/hadoop下有几个*-site.xml的配置文件,可以把etc/hadoop目录复制到另一个位置,这样安装文件和配置文件隔离开,需要将HADOOP_CONF_DIR指向该目录


2018-11-20 16-28-41屏幕截图.png

core-site.xml中添加


2018-11-20 16-32-08屏幕截图.png

hdfs-site.xml中添加


2018-11-20 16-33-24屏幕截图.png

yarn-site.xml
2018-11-20 16-34-13屏幕截图.png

(3)

配置ssh无密码登陆

安装 ssh,之前请确保apt已更新
$ sudo apt-get install ssh
基于空口令生成一个新SSH密钥,以实现无密码登陆

$ ssh-keygen -t rsa -P ' ' -f ~/.ssh/id_rsa

$ cat ~/.ssh/id_rsa.pub >> ~/.ssh/authorized_keys

测试是否连接
$ ssh localhost
如果成功则不需要输入密码

(4)
在首次使用hadoop前,必须格式化文件系统。
先修改用户的权限 chown -R 用户名 /usr/local/hadoop
hdfs namenode -format
启动HDFS、YARN和MapReduce守护进程
start-dfs.sh


2018-11-20 16-52-48屏幕截图.png

start-yarn.sh


2018-11-20 16-53-04屏幕截图.png

mr-jobhistory-daemon.sh start historyserver
2018-11-20 16-53-26屏幕截图.png

本地计算机将启动以下守护进程:一个namenode、一个辅助namenode、一个datanode(HDFS)、一个资源管理器、一个节点管理器(YARN)和一个历史服务器(MapReduce)
Hadoop安装目录下logs目录中日志文件可以检查守护进程是否成功启动
Web界面:http://localhost:50070/ 查看namenode

              http://localhost:8088/   查看资源管理器 
2018-11-20 17-05-50屏幕截图.png
              http://localhost:19888/ 查看历史服务器

还可以通过Java的jps命令,


2018-11-20 17-08-32屏幕截图.png

创建一个主目录
$ hadoop fs -mkdir -p /user/tce

3.Hadoop自带wordcount测试

进入/usr/local/hadoop/bin,创建目录input
寻找一组英文网页,这里我选择github的主页https://github.com/
查看源代码,拷贝到input目录下的github.html

2018-11-20 17-20-06屏幕截图.png

在编写text1.txt:hello excuse me fine thank you,text2.txt:hello how do you do thank you
把input目录下文件添加到hadoop输入
cd /usr/local/hadoop/bin
hadoop dfs -put input in
确认一下
hadoop dfs -ls ./in/*
2018-11-20 17-36-12屏幕截图.png

运行wordcount
hadoop jar /usr/local/hadoop/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.8.5.jar wordcount in output


2018-11-20 17-38-26屏幕截图.png

hadoop-mapreduce-examples-2.8.5.jar这个jar包在/usr/local/hadoop/share/hadoop/mapreduce/

2018-11-20 17-38-49屏幕截图.png

登陆http://localhost:50070/ 查看namenode
2018-11-20 17-42-05屏幕截图.png

键入 hadoop dfs -cat ./output/* 查看输出结果
2018-11-20 17-44-44屏幕截图.png

参考资料:

《Hadoop权威指南》大数据的存储与分析 第四版
http://www.cnblogs.com/aijianiula/p/3850002.html
https://blog.csdn.net/t555222/article/details/77882747

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,490评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,581评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,830评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,957评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,974评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,754评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,464评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,357评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,847评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,995评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,137评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,819评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,482评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,023评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,149评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,409评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,086评论 2 355

推荐阅读更多精彩内容

  • 一、系统参数配置优化 1、系统内核参数优化配置 修改文件/etc/sysctl.conf,添加如下配置,然后执行s...
    张伟科阅读 3,754评论 0 14
  • 最近在实践中感觉Hadoop避无可避,而安装往往就体验一把从入门到放弃。尽管环境搭建现在越来越简单,但是还是有很多...
    羽恒阅读 11,634评论 0 1
  • 版权声明:本文为博主原创文章,未经博主允许不得转载。 目录-[-]1 先决条件2 实验环境搭建 21 准备工...
    三三At你阅读 841评论 0 3
  • 终极算法 关注微信号每天收听我们的消息终极算法为您推送精品阅读 前言 Hadoop 在大数据技术体系中的地位至关...
    Yespon阅读 129,957评论 12 168
  • 生活当中那些为数不多的相伴,理所当然是弥足珍贵的…… 我来大理大学读书也有两年了,要问我在这里待的最久...
    坏女孩sunny阅读 1,143评论 0 4