大数据学习(Hadoop3.0安装与样例测试)

首先,最新的Apache Hadoop已经3.0了,为了跟上时代我还是配3.0的吧。然后,因为所给的教程是2.*,网上的基本也是1.*和2.*,所以配置的的时候可以说是山路十八弯,这里把过程详细写写。

1.下载,解压,配置环境变量,不用多说


2.配置相关文件(Hadoop3.0版本)

进入解压目录

执行如下命令,创建一些数据缓存的文件夹:

mkdir hdfs

mkdir tmp

mkdir /hdfs/name

mkdir /hdfs/data

进入etc/hadoop文件下编辑相关文件

①首先深呼吸,保证等会不要抄错代码(自己手打一遍)

② 修改yarn-env.sh  以及 mapred-env.sh,指定 JAVA_HOME

③ 打开slaves,添加分节点主机名   打开wokers,添加分节点主机名

④ 打开core-site.xml编辑,配置hdfs地址和端口

Master是主机名,~/tmp 是我们开始创建的文件夹目录

⑤ 打开hdfs-site.xml,配置副本的个数及数据的存放路径

~/name,~/data同理,别照教程直抄上去。

⑥ 打开mapred-site.xml,重点配置

这是第一步,与之前版本无异,配置使用yarn框架执行map-reduce处理程序,然后不同的是,在格式化HDFS文件系统后,我们还得配置第二步。

新加了两段话。如果不加的话,后面测试样例会让人怀疑人生。

报错如下:NoClassDefFoundError:org/apache/hadoop/mapreduce/v2/app/MRAppMaster

⑦ 打开yarn-site.xml,配置resourcemanager,nodemanager通信端口

⑧ scp 命令将Master中的hadoop文件夹复制到2个分节点上(说白了就是让三个节点的hadoop一模一样,别忘了jdk)



3.启动集群

①启动hadoop集群

格式化文件系统,在主节点上执行命令:hadoop namenode–format

进入sbin文件夹,启动hdfs,执行:./start-dfs.sh

检查

每个节点执行:jps 在主节点启动了NameNode和SecondaryNameNode,分节点均启动了DataNode则启动成功

②启动yarn集群

在sbin文件夹下,主节点执行命令:./start-yarn.sh

主节点启动了ResourceManager,分节点上启动了NodeManager则启动成功

至此大功告成。

问题1:未知的莫名其妙的错误

解决方法:首先检查文件配置有没错误的单词字母

问题2:第二天起床namenode启动不了

解决方法:很有可能是格式化文件系统后,又格式化了一次。尝试吧 tmp 和 hdsf/name 、hdfs/data 以及 log 中的文件全部删除,再格式化后启动试试

笔记:

1.kill 命令可以结束进程

2.每次启动集群需要去到hadoop中sbin的文件夹下执行命令,有点不方便,可以在etc的profile文件中export一个HADOOP_HOME,然后在PATH中添加:$HADOOP_HOME/sbin即可,注意添加的格式和标点。

3.格式化文件系统一次就够了,之后只需start相关内容

4.可以提前把sublime text3这款软件装好


二.使用Hadoop MapReduce V2样例代码快速测试系统

进入如下目录,测试的jar文件在这里。

执行如下代码

最终我们想要的结果大概就是这样的。

问题1:报错“ xx of xx virtual memory used.....Killing container..".查阅资料后,应该是虚拟内存超了的问题

解决方法:在yarn-site.xml文件中加入如下的话让他不检查虚拟内存

问题2:“ssh client refused....”

解决方案:每台虚拟机都依次跑两个命令再试试

问题3:第二天起床可能会发生如下问题,安全模式开启了

解决方法:那我们就关掉它,执行命令hadoop dfsadmin -safemod leave

笔记:

1.这个目录下的jar文件储存了hadoop里的很多测试样例,比如还有wordcount,具体的网上搜。我们的pi命令就是计算Pi,π(为什么等于3.8... ..)后面2个数字参数的含义:第1个2指的是要运行2次map任务,第2个数字10指的是每个map任务,要执行多少次

2.操作一定要规范,操作一定要规范,操作一定要规范任何的失误都可能浪费巨多的时间,像我重装Hadoop几次都装出内伤了。

3.学会看Log,真的学会看Log,很多玄学问题的解决方案都是可以从Log中看出端倪的,不然查解决方案都没有头绪。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,470评论 6 501
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,393评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,577评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,176评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,189评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,155评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,041评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,903评论 0 274
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,319评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,539评论 2 332
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,703评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,417评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,013评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,664评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,818评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,711评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,601评论 2 353

推荐阅读更多精彩内容