spark使用addFile

addFile

addFile可以把文件分发到各个worker当中,然后worker会把文件存放在临时目录下。之后可以通过SparkFiles.get()获取文件

代码

from pyspark import SparkFiles
from pyspark.sql import SparkSession

# 创建SparkSession
spark = SparkSession.builder\
    .master("local")\
    .appName("cal person")\
    .getOrCreate()
# 添加文件
spark.sparkContext.addFile("./dict/load_dict.txt")
# 获取文件
with open(SparkFiles.get("load_dict.txt"), "r") as f:
    print(f.read())
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容