windows上的IDEA执行mapreduce的崎岖之路

    这条路走的很曲折，但让我喜欢上了一句话，“故事的结局很美好，如果不美好，那肯定是还没有结局”。

问题来源：
初学hadoop,在运行MapReduce时，需要先打包生成jar包，再上传jar包到集群，最后执行jar包。刚开始没觉得有何不妥，但多次操作后，发现上传jar包、执行jar包还是有点麻烦。恰好看到老师可以直接在eclipse上执行mapreduce,便冒出了在idea上执行的冲动。

1.首先是我的resources目录,resource目录的结构决定了你是运行在本地还是集群。

3dc6f84e88f9e5567e811436e0bc775.png

2.当我生成jar包，在集群上成功运行时，我知道我的代码没问题。于是我删除hdfs上的目录，在idea上执行main函数。
报出了第一个错：

41c00b068670501ce1d67ea49d24d2f.png

这是个RpcNoSuchMethodException:即Rpc不存在该方法异常。考虑到Rpc的通信机制是通过相同的函数名来调用，这个异常也就意味着我idea上的hadoop上有setErasureCodingPolicy这个方法，而集群上的hadoop却没这个方法，于是我看了我idea上hadoop的版本是3.0.0，而集群的hadoop是2.5.0.这估计就是原因，我改了idea的hadoop版本为2.5.0这个问题解决了。

2.继续执行main函数，结果遇到了第二个错误。

1529060715(1).png

这是个Permission denied，权限拒绝，执行的用户是jyj，而不是用户root。事实上我的hadoop所有操作都是root用户在执行。问题是这里怎么变成了‘jyj’用户？想必是哪里应该设置为root用户而我没设置，而设置肯定既可以在xml中设置也可以在代码中设置。经过百度的不懈搜寻，我找到了解决的一个办法，至于另外一个办法，我知道存在，但不知道在哪里。
于是我在main函数里面指定了执行的用户为root

System.setProperty("HADOOP_USER_NAME", "root");

3.继续执行main函数，好巧遇到了第三个错误。

1529061442(1).png

Could not locate executable null\bin\winutils.exe in the Hadoop binaries

这个错误呀，搜过之后才知道老掉牙了，不过是解决linux和window跨平台的一个winutils执行文件没有，于是下载，按照别人的介绍进行操作，什么配置环境变量啊，重启电脑啊，，等等。
不过现在回头看，根本没必要这么做。

4.继续执行main函数，不出所料遇到了第四个错误。因为我知道，问题还多着呢。但没想到这个问题竟这么难缠。

Job job_1528955449633_0014 failed with state FAILED due to: Application application_1528955449633_0014 failed 2 times due to AM Container for appattempt_1528955449633_0014_000002 exited with  exitCode: 1 due to: Exception from container-launch: ExitCodeException exitCode=1: /bin/bash: line 0: fg: no job control

ExitCodeException exitCode=1: /bin/bash: line 0: fg: no job control

''no job control'',这个问题字面上是那么好懂，但真的难缠。
百度上提供了一种方式，而且出现了好多次，就是在yarn-site.xml配置属性：如下

<property>
    <name>yarn.application.classpath</name>
    <value>
        /opt/hadoop-2.6.0/etc/hadoop,
        /opt/hadoop-2.6.0/share/hadoop/common/*,
        /opt/hadoop-2.6.0/share/hadoop/common/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/*,
        /opt/hadoop-2.6.0/share/hadoop/hdfs/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/*,
        /opt/hadoop-2.6.0/share/hadoop/mapreduce/lib/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/*,
        /opt/hadoop-2.6.0/share/hadoop/yarn/lib/*
    </value>
  </property>

我以为这下好了，运行后，依然报那个错误。
怎么办？到底是哪里原因？是我的hadoop版本太低了，不行吗？于是乎，我装了hadoop2.7.6.当然那些配置文件一个一个改起来，真是烦的无可奈何，稍不留神不是少改就是写错。经过nanenode format,来来回回启动多次hadoop,终于装好了2.7.6.
于是乎，再次执行main函数，心中期盼着这次能成功，但是。。。。。依然不行。
我检查百度提供的方法，怀疑我是不是复制错了，看了一遍又一遍，没错的呀。
无可奈何花落去，难道就要止步这里了吗？
再百度百度吧，实在不行就每次都执行jar包，也还是能接受的。或许以后就知道怎么解决了。我内心已经这么决定了。
又搜索了几次后，终于一个方法让我眼前一亮。

    在yarn-site.xml里面添加：

    <property>
        <name>mapreduce.app-submission.cross-platform</name>
        <value>true</value>
    </property>

因为我知道"no job control"肯定是与yarn有关，因为yarn是来控制job的。而yarn的配置就是在yarn-site.xml里面。再看一下name,cross-platfrom跨平台的意思，这不就意味着windows和linux这两个平台吗？我所有的问题不就是因为平台不同导致的吗？
终于呀，终于找到了。
我把idea和集群上的yarn-site.xml都做了相应的修改。

5、执行main之后，果不其然“no job control”的问题没了，但又出现了新的问题。

6358e4cecd1c79258b92b008ddf1e71.png

这个问题是classNotFoundException,找不到定义的mapper类。这不逗我的吗，明明有这个类，不然我集群执行jar包怎么不报错？思前想后以及百度，让我确定需要在代码中添加jar包，也即要调用

job.setJar()

方法，问题是String类型的参数填什么？我尝试填类名、填jar包名。但一运行就报错，说找不到相应jar包。你不是找不到jar包吗？那我干脆直接把jar包的完全路径写上去。这下总能找到了吧。

历经千辛万苦，终于成功的执行了一次。
喜悦之情，难于言表。

6、回过头来，我看了看设置跨平台这个属性，既然hadoop带有这个属性，那我还需要在windows环境变量中配置winutils吗？我把winutils的路径改了，不用winutils,结果还是顺利执行了。

7、与同学的商讨打开了好多思路，也让我意识到，idea运行的mapreduce是既可以在集群上执行，也可以直接在本地的hadoop执行。就看resources的目录配置了。老师eclipse运行的mapreduce,是在本地运行还是在集群上运行，这曾让我疑惑很久的问题，豁然开朗。

路上很艰难，但若不艰难，怎么能感受到结局的美好呀。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355

windows上的IDEA执行mapreduce的崎岖之路

推荐阅读更多精彩内容