大兄弟写的很棒,有一点补充一下,standlonw 情况下有两种:deploy-mode client 和deploy-cluster 的区别就是,client必须在集群上的某个节点执行,所谓的客户端,也就是说提交应用程序的节点要作为整个程序运行的客户端,也就是说这个节点必须从属于集群!而cluster顾名思义,就是集群的意思,可以理解为提交的程序在某个集群运行,也就是说提交的机器只需要拥有单机版的spark环境就行了,至于提交的地方是哪里通过spark://指定就行了,提交的机器只作为提交的功能,提交完了之后就和他无关了!
IP属地:北京