chinfun - 简书

发简信

chinfun

0
关注
1
粉丝
2
文章
16

字数
0

收获喜欢
1

总资产

IP属地：云南

chinfun

@步闲在输出路径前面写hdfs://cluster1或hdfs://cluster2

Spark操作多HDFS集群
由于特殊需求，需要在一次Spark任务中切换HDFS集群。本文我将介绍如何在一次的spark任务中操作不同的HDFS集群我们以wordcount为例，分析如何配置。我们的...

cda766963c7e
10122 9 6
chinfun

Flink输出到HDFS自定义分区
获取分区路径获取输出数据最终结果

843 0 0

chinfun

Spark对多HDFS集群Namenode HA的支持

778 1 0
chinfun

楼主的配置有问题，应该把多个key相同的属性配置在一起
val sc = new SparkContext()
// 多个HDFS的相同配置
sc.hadoopConfiguration.setStrings("fs.defaultFS", "hdfs://cluster1", "hdfs://cluster2");
sc.hadoopConfiguration.setStrings("dfs.nameservices", "cluster1", "cluster2");
// cluster1的配置
sc.hadoopConfiguration.set("dfs.ha.namenodes.cluster1", "nn1,nn2");
sc.hadoopConfiguration.set("dfs.namenode.rpc-address.cluster1.nn1", "namenode001:8020");
sc.hadoopConfiguration.set("dfs.namenode.rpc-address.cluster1.nn2", "namenode002:8020");
sc.hadoopConfiguration.set("dfs.client.failover.proxy.provider.cluster1", "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider");
// cluster2的配置
sc.hadoopConfiguration.set("dfs.ha.namenodes.cluster2", "nn3,nn4");
sc.hadoopConfiguration.set("dfs.namenode.rpc-address.cluster2.nn3", "namenode003:8020");
sc.hadoopConfiguration.set("dfs.namenode.rpc-address.cluster2.nn4", "namenode004:8020");
sc.hadoopConfiguration.set("dfs.client.failover.proxy.provider.cluster2", "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider");

Spark操作多HDFS集群
由于特殊需求，需要在一次Spark任务中切换HDFS集群。本文我将介绍如何在一次的spark任务中操作不同的HDFS集群我们以wordcount为例，分析如何配置。我们的...

cda766963c7e
10122 9 6
chinfun

程序员
小彤花园编，95762 篇文章，1666389 人关注

如果你是程序员，或者有一颗喜欢写程序的心，喜欢分享技术干货、项目经验、程序员日常囧事等等，欢迎投稿《程序员》专题。专题主编：小彤花园 http://www.jianshu.com/users/4a4eb4feee62/ 【程序员】专题拒稿指北：http://www.jianshu.com/p/7c8b33b5f63b 投稿须知： 1.收录相关技术文章，但不限于技术，也可以是项目经验类的文章和程序员日常。 2.文章內不得有任何推广信息。包括但不限于公众号、微博、微信，更不得在通过投稿后再修改文章加入推广信息。你可以将这些推广以及个人信息放在个人主页介绍里。 3.字数极少，段落混乱，大段代码没有放到代码框的文章不收录 4.不相关的内容不收录，请确认文章内容和本专题相关目前针对优质作者及爱好者，开设了官方程序员微信群，希望加入请发简信给主编小彤花园索取个人微信，主编会将你加入到【程序员】微信群，分享内容，收获知识。添加微信时备注昵称。
chinfun