登录注册写文章

spark连接elasticsearch

spark连接elasticsearch

从hbase读取数据，插入es。第一批大约400w数据，用时4mins。

importorg.elasticsearch.spark._

importorg.elasticsearch.hadoop.cfg.ConfigurationOptions._

source += (ES_NODES->"127.0.0.1")

source += (ES_PORT->"9200")

source += (ES_BATCH_SIZE_BYTES->"5mb")

mediaRDD.map({case(w,r) => {

varrow:String=""

varsex:String=""

varage:String=""

valesMap = scala.collection.mutable.Map[String,String]()

r.list().map(keyValue => {

valq:String= keyValue.getQualifier

row = keyValue.getRow

valmArr = q.split("_")

if(q.startsWith("sex")) sex = mArr(1)

if(q.startsWith("age")) age = mArr(1)

})

r.list().map(keyValue => {

valq:String= keyValue.getQualifier

if(q.startsWith("province")) {

valmArr = q.split("_")

esMap += ("province"-> mArr(3),"media"-> mArr(4),"sex"-> sex,"age"-> age,"deviceId"-> row)

}

})

esMap

}

}).saveToEs(s"$index/$t",source)

sc.stop

}

}

最后编辑于：2017.12.05 04:12:33

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Spark连接Elasticsearch总结
spark连接elasticsearch总结与问题汇总，先立个flag，内容以后再写~.~
本宝宝天然萌阅读 1,222评论 4赞 1
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
Joyyx阅读 8,354评论 0赞 16
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
草里有只羊阅读 18,392评论 0赞 85
诗和远方
大千世界，芸芸众生，你在不多，你不在不少，你走，时间在走，你不走，时间在走！人活一世，走过的路，是沿途的风景，经...
我是子非鱼阅读 269评论 0赞 0
学思结合
子曰：学而不思则罔，思而不学则殆。此句中，“思”的意思是思考；“罔”的意思是迷惑；“殆”的意思是没有信心。整句话...
蓝血十杰阅读 778评论 0赞 0

赞1赞

赞赏

手机看全文