第十五章调度管理

第十五章调度管理

常用的作业调度基本概念:

Job:作业,一次Action生成的一个或多个Stage组成的一次计算作业
Stage:调度阶段,不需要进行Shuffle的调度过程,一个任务及所对应的调度阶段
TaskSet:任务集,一组相互关联的,且没有Shuffle依赖关系的任务组成的集合
Task:任务,单个分区数据集上的最小处理单元

1 应用程序间的调度

静态资源分配
动态资源分配:资源分配策略

2 应用程序中的调度

公平调度池
配置调度池属性

3 调度器

1)简介

调度器

2)调度池

调度池

3)Job调度流程

Job调度流程

提交并运行一个Job的基本流程:
1、划分Job
2、生成Job,提交Stage
3、任务集的提交
4、任务作业完成状态的监控
5、任务结果的获取

4)调度模块

1、DAGScheduler

DAGScheduler是一个高级的Scheduler层,它实现了基于Stage的调度,为每一个Job都计算Stage,跟踪哪一个RDD和Stage的输出被固化,以及寻找到执行Job的最小的调度,然后将Stage作为TaskSets提交给底层的TaskScheduler,有TaskScheduler执行。
DAGScheduler的主要功能是接受用户提交的Job,将Job根据类型划分为不同的Stage,并在每一个Stage内产生一系列的Task,向TaskScheduler提交Task。

2、TaskSetManager

DAGScheduler负责将一组任务提交给TaskScheduler以后,这组任务的调度工作已经完成,接下来这组任务内部的调度逻辑,则是由TaskSetManager完成的。

3、TaskScheduler

每一个TaskScheduler只为一个单独的SparkContext进行调度安排的任务,DAGScheduler会为每一个阶段向TaskScheduler提交taskset(也就是说,taskset是在DAGScheduler完成组装),TaskScheduler会负责向集群发送任务,并且调用后台运行任务。同时,在任务失败时重试,然后会将运行任务,重试任务的事件返回给DAGScheduler。

TaskSchedulerListener:TaskSchedulerListener部分的主要功能是监听用户提交的工作,将工作分解为不同类型的舞台以及相应的任务,并向TaskScheduler提交任务。

TaskScheduler:TaskScheduler接收用户提交的任务并执行。
TaskScheduler根据部署的不同又分为三个子模块:ClusterScheduler,LocalScheduler,MesosScheduler,TaskScheduler会根据部署方式而选择不同的SchedulerBackend来处理。

在SparkContext.createTaskScheduler中,针对不同的部署方式会>有不同的TaskScheduler与SchedulerBackend进行组合:
Local模式:TaskSchedulerlmpl + LocalBackend;

Spark集群模式:TaskSchedulerlmpl + SparkDepolySchedulerBackend;

Yarn-Cluster模式:YarnClusterScheduler + CoarseGrainedSchedulerBackend;

Yarn-Client模式:YarnClientClusterScheduler + YarnClientSchedulerBackend

TaskScheduler类负责任务调度资源的分配,SchedulerBackend负责与主人,工人通信收集工人上分配给该应用使用的资源情况。

4、Stage
根据RDD依赖关系的不同, Spark也将每一个Job分为不同的Stage,而Stage之间的依赖关系则形成DAG,

  • 对于NarrowDependency, Spark会尽量多地将RDD转换放在同一个Stage中;
  • 而对于WideDependency, 由于WideDependency通常意味着Shuffle操作,因此Spark会将此Stage定义ShuffleMapStage,以便于向MapOutputTracker注册Shuffle操作。

Spark通常将Shuffle操作定义为Stage的边界。

  • (1) ShuffleMapStage
    这种Stage是以Shuffle为输出边界,其输入边界可以是从外部获取数据,也可以是另一个ShuffleMapStage的输出,其输出可以是另一个Stage的开始。ShuffleMapStage的最后Task就是ShuffleMapTask,在一个Job里可能有该类型的Stage,也可能没有该类型的 Stage。
  • (2) ResultStage
    这种Stage是直接输出结果,其输入边界可以是从外部获取数据,也可以是另一个 ShuffleMapStage的输出。ResultStage的最后Task就是ResultTask,在一个Job里必定有该类,型的Stage,一个Job含有一个或多个Stage,但至少含有一个ResultStage.

5)存储管理

1、Shuffle数据持久化
由于Shuffle涉及了磁盘的读写和网络的传输,因此Shuffle性能的高低直接影响到整个程序的运行效率。

2、存储层storage
在Storage模块中所有的操作都是和Block相关的,但是在RDD中所有的运算都是基于Partition的,那么Partition是如何与Block对应上的呢?

RDD的Transformation, Action和Block数据建立了联系,虽然抽象上我们的操作是在Partition层面上进行的,但是Partition最终还是被映射成为Block,因此实际上我们的所有操作都是对Block的存取和处理。

6)RDD分区和数据块关系

1)分区和数据块一一对应
2)分区和数据块的对应关系是通过名称上的约定进行的,每个RDD都有一个唯一的ID,每个分区都有唯一的索引,以ID+索引号作为数据块名便自然的建立起了分区与块的映射。


Boy-20180717

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,110评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,443评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,474评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,881评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,902评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,698评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,418评论 3 419
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,332评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,796评论 1 316
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,968评论 3 337
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,110评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,792评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,455评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,003评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,130评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,348评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,047评论 2 355