yarn-cluster和yarn-client提交模式的区别

1、你要切换到yarn-cluster或者yarn-client模式,很简单,将我们之前用于提交spark应用程序的spark-submit脚本,加上--master参数,设置为yarn-cluster,或yarn-client,即可。如果你没设置,那么,就是standalone模式。
2、yarn集群分为主节点和从节点,一个主节点是ResourceManager(RM),多个从节点是NodeManager(NM)。
3、
3.1、如果是yarn-cluster模式,spark-submit在提交的时候请求到ResourceManager,请求来启动ApplicationMaster,ResourceManager接收到请求后会分配一个container,在某个NodeManager上启动ApplicationMaster,ApplicationMaster(AM)启动后会反过来向ResourceManager进行通讯,其实这个ApplicationMaster就相当于是driver,AM找RM请求container,启动excutor,然后RM会分配一批container,用于启动executor,AM链接其他的NM,来启动executor,这里的NM相当于worker,executor向AM反向注册。ResourceManager相当于之前的master。
3.2、yarn-client模式,spark-submit在提交的时候发送给RM,请求启动AM,分配一个container,在某个NM上,启动AM,但是这里的AM只是一个ExecutorLauncher,功能是很有限的。AM启动后会找RM申请container,启动executor,AM链接其他的NM,用container的资源来启动executor。executor会反向注册到本地的driver上。
4、区别:yarn-cluster的driver相当于就是在NodeManager上的某一个ApplicationMaster;yarn-client的driver还是在本地启动的一个进程,在NodeManager启动的ApplicationMaster只是一个ExecutorLauncher,ExecutorLauncher只会向ResourceManager申请资源,然后用container资源去链接其他的NodeManager,然后去启动executor,executor启动后会反向注册到提交应用程序的本地客户端的driver进程上,通过本地客户端的driver进程里面的DAGScheduler、TaskScheduler会大量进行task的调度,发送到NodeManager上的executor上去执行。


image.png
基于YARN的两种提交模式深度剖析.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 《超级记忆》,作者东尼博赞,著名的思维导图创造者,也是世界记忆大赛的创始人之一。超级记忆的核心是关联与联想,具体的...
    启鸿阅读 677评论 0 1
  • 今天突然知道以前很喜欢的一本杂志新蕾story停刊了,心里有点难过有点失落。记得在我上学的时候,那段学校和家两点一...
    月浅眠阅读 304评论 0 1
  • 妈妈去世五个月零七天,和妈妈相关的话题依旧不敢触碰。 以前遇到不俗谈吐的同事会特别留意,现在把相信有灵魂存在的人当...
    Blues_1bfa阅读 255评论 0 0
  • 一、谷歌浏览器开发者工具 网页右键-->检查(审查元素) F12快捷键 Elements选项查看元素 networ...
    苏打丶观阅读 1,107评论 0 1
  • 1.习惯原理。养成一个习惯最开始是最艰难的,但是顺利地走过起跑期、疲惫期、过渡期、稳定期这四个阶段,就能很好的掌控...
    MSXiang阅读 120评论 1 1