在spark-shell中进行wordcount的流程分析

image.png

wordcount 产生4个RDD，会被划分成两个stage：ShuffleMapStage和ResultStage

这个job会有两个分区，所以这两个stage会分别产生两个task，每个task会被尝试执行多次直到执行完毕。

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

SPARK优化
1.1、分配更多资源 1.1.1、分配哪些资源？ Executor的数量每个Executor所能分配的CPU数...
miss幸运阅读 8,385评论 3赞 15
spark调优
1、性能调优 1.1、分配更多资源 1.1.1、分配哪些资源？ Executor的数量每个Executor所...
Frank_8942阅读 10,099评论 2赞 36

==Spark系列(九)DAGScheduler工作原理
Spark系列(九)DAGScheduler工作原理 - 会飞的纸盒 - 博客园http://www.cnblog...
葡萄喃喃呓语阅读 4,744评论 0赞 1
Structure Streaming[Official Document]
1. Overview： Structured Streaming是基于Spark SQL引擎的可扩展、具有容错性...
奉先阅读 7,993评论 0赞 1
【连载《梦里几何十八》第十八章瞬间即是永恒】
会消失的光，留不住的愿景。它不会实现，就像它本不该发生一样。瞬间有多久，有时候快得让人数不完。永恒有多久，有时...
蓝色忧忧阅读 3,110评论 0赞 3

赞1赞

赞赏

手机看全文