Spark 分析Json数据存入Mysql 遇到的坑

# Spark 分析Json数据存入Mysql 遇到的坑

折腾了两天,终算是弄好了,入的坑不计其数,但是也要数一数。

坑(一)

之前搭建好了spark,就是简单的wordcount一下,成功了也就没在意。

这几天重新拾起来,一上来就记得 --master spark://master:55555

这个55555端口其实是我的hdfs的端口,结果给记成spark群集的了,哇,很难受,一直卡住

说什么master不通,查了半天,忽然想起怎么不加 --master这个配置反而执行成功了,

查了一下不加 --master默认 --master local,呀,紧跟着后边 --master spark://master:7077

(默认端口为7077)

~~~~~~~~~

恍然大悟,很难受,这样一来,通了。。。。。

-------

坑(二)

```

17/04/30 13:37:29 INFO scheduler.TaskSchedulerImpl: Adding task set 0.0 with 2 tasks

17/04/30 13:37:44 WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

17/04/30 13:37:59 WARN scheduler.TaskSchedulerImpl: Initial job has not accepted any resources; check your cluster UI to ensure that workers are registered and have sufficient resources

```

查了一下,大体意思就是内存不足,资源不足。。。这个好办,改了一下配置文件,不知道起没起作用,估计是没起作用,

在spark目录中的spark_env.sh中添加了export SPARK_EXECUTOR_MEMORY=512M

其实主要不在这里,不加的话默认为1G。

就是启动命令上我们 --executor-memory 1G 或者--executor-memory 512M 都没问题,

--executor-memory 2G就有问题了。

这样资源不足的问题也解决了。

-------

坑(三)

提交作业后,总是执行一半卡住,估计连一半也没执行,看了后台的works 输出日志,

```

com.mysql.jdbc.exceptions.jdbc4.CommunicationsException: Communications link failure

```

这错误挺明显的,就是数据库连接失败了。

开始思考,是不是提交作业到群集每个slave上都需要一个 mysql.jdbc包呢,试了一下,

--jars /home/examples/mysql.jar 这个配置一开始就有,我只是在master上存在mysql.jdbc包,

于是把mysql.jdbc包放到slave的相同的位置。结果还是不行。。。

还是一样的错误。。。

。。。。。。。。。。。

一宿过去了。。。。。。。。。。

爬起来,继续干,灵光一现,,,,,,,,

```

"jdbc:mysql://localhost:3306/"+mysql_database+"?user="+mysql_user+"&password="+mysql_password

```

scala中连接数据库我是这样写的,localhost的,有没有,发现问题了吧。。。。

目前只是猜测,,,,,

我猜,slave向master连接数据库时出现了问题。。。。

slave上并没有mysql,,,

我们需要把数据都存入master上,

试着把localhost改成master,,,,哇哦。。。

成功了呢。。。。。

开心不

开心。

-------

到上边已经算是结束了。

过程中还有一坑,,,就是一开始自己写了个wordcount结果存入mysql的小实验,

```

val conf = new SparkConf().setAppName("RDDToMysql").setMaster("local")

```

配置这样写的。。。。。

我特么怎么说不管 --master spark 还是 --master local都成功。。。问题在这里呀。我该

写成空配置

```

val conf = new SparkConf()

```

还有,,,,要处理json,,,sc.textFile肯定是不太好的,因为他都是一行一行的读取的,

如果你的json数据不是规则的一行一个数据,那就完蛋了。

最好的方式就是读取批量小文件 ,我们规定一个txt文件只有一条json数据。。

直接读取整个文件

sc.wholeTextFiles()完美

赶紧分析点有趣的数据,,,哈哈

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容