Spark:Spark使用textFile读取本地文件时出错：org.apache.hadoop.mapred.InvalidInputException: Input path does no...

1.错误信息：

org.apache.hadoop.mapred.InvalidInputException: Input path does not exist: file:/emp.csv
  at org.apache.hadoop.mapred.FileInputFormat.singleThreadedListStatus(FileInputFormat.java:287)
  at org.apache.hadoop.mapred.FileInputFormat.listStatus(FileInputFormat.java:229)
  at org.apache.hadoop.mapred.FileInputFormat.getSplits(FileInputFormat.java:315)
  at org.apache.spark.rdd.HadoopRDD.getPartitions(HadoopRDD.scala:202)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
  at scala.Option.getOrElse(Option.scala:121)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
  at scala.Option.getOrElse(Option.scala:121)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)
  at org.apache.spark.rdd.MapPartitionsRDD.getPartitions(MapPartitionsRDD.scala:35)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:252)
  at org.apache.spark.rdd.RDD$$anonfun$partitions$2.apply(RDD.scala:250)
  at scala.Option.getOrElse(Option.scala:121)
  at org.apache.spark.rdd.RDD.partitions(RDD.scala:250)

错误信息

2.错误原因：是因为自己是在搭建的一个spark集群上执行这歌命令，而集群中每一个节点都要工作，都要找到自己节点的本地文件，因此需要每一个节点的路径下都要存在对应的文件。所以需要在每一个节点中的相同目录都存在该文件，之后问题解决：

3.解决方法：

在每一个节点的相同目录下放置该文件，即可

最后编辑于：2019.12.09 18:01:32

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

Spark:Spark使用textFile读取本地文件时出错：org.apache.hadoop.mapred.InvalidInputException: Input path does no...

Spark:Spark使用textFile读取本地文件时出错：org.apache.hadoop.mapred.InvalidInputException: Input path does no...

相关阅读更多精彩内容

友情链接更多精彩内容