spark 参数

spark.default.parallelism Default number of partitions in RDDs returned by transformations like join, reduceByKey, and parallelize when not set by user.
reducer的个数
spark.sql.shuffle.partitions denote the number of reducers in a join/group-by operation (dataframe)

最后编辑于：2017.12.08 04:44:34

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
草里有只羊阅读 18,455评论 0赞 85
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 ...
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingConte...
草里有只羊阅读 9,667评论 0赞 11

Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 ...
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingConte...
Joyyx阅读 10,839评论 0赞 26
Apache Spark 2.2.0 中文文档 - Spark SQL, DataFrames...
Spark SQL, DataFrames and Datasets Guide Overview SQL Dat...
Joyyx阅读 12,599评论 0赞 16
别拿“文化差异”降低做人的底线
怎么说呢，虽然多少有些在气头上的情绪，但这个经历也着实给我上了一课。人与人之间的信任并不那么容易被建立起来，更别提...
Redfever阅读 4,474评论 4赞 8

友情链接更多精彩内容

赞1赞

赞赏

手机看全文