240 发简信
IP属地:北京
  • Resize,w 360,h 240
    Spark-Core源码精读(15)、Shuffle--Read部分

    上一篇文章我们分析了Shuffle的write部分,本文中我们来继续分析Shuffle的read部分。 我们来看ShuffledRDD中的com...

    0.2 7710 1 10 1
  • Resize,w 360,h 240
    Spark-Core源码精读(14)、Shuffle--Write部分

    前面我们分析了Spark中具体的Task的提交和运行过程,从本文开始我们开始进入Shuffle的世界,Shuffle对于分布式计算来说是至关重要...

  • Resize,w 360,h 240
    Spark-Core源码精读(13)、Task的运行流程分析

    上一篇文章我们着重分析了Task的提交过程,本文中我们将对Task的运行进行详细的分析。 我们从CoarseGrainedExecutorBac...

  • Spark-Core源码精读(12)、Task的提交流程分析

    上一篇文章我们谈到,DAGScheduler将Job划分成由Stage组成的DAG后,就根据Stage的具体类型来生成ShuffleMapTas...

  • Resize,w 360,h 240
    Spark-Core源码精读(11)、Stage的划分过程和Task数据本地性

    本文将主要讨论两个Topic:Stage的划分过程和Task数据本地性 引子 前面的文章中我们已经分析了Spark应用程序即Applicatio...

  • Resize,w 360,h 240
    Spark-Core源码精读(10)、注册Application及Executors的启动注册流程(二)

    承接上一篇文章,我们继续来分析Executor的启动过程,本文主要分为两部分: 向worker发送启动Executor的消息 启动完成后向dri...

  • Resize,w 360,h 240
    Spark-Core源码精读(9)、注册Application及Executors的启动注册流程(一)

    接下来的几篇文章我们会结合源码来分析注册Application以及启动Executor并向Driver注册的具体流程。 上文我们跟踪源码到了Sp...

  • Resize,w 360,h 240
    Spark-Core源码精读(8)、TaskScheduler和SchedulerBackend

    从本文开始,我们进入Spark中的调度部分,首先本文将对TaskScheduler和SchedulerBackend的实现原理进行分析。 我们从...

  • Spark-Core源码精读(7)、“Driver“服务启动流程解析

    本文将解析Spark中Driver服务的开启流程,闲言少叙,直接进入源码。 首先Driver服务的开启是在创建Driver的运行时环境的时候完成...

个人介绍
致力于大数据技术和相关的学习和研究,包括但不限于:Spark、Hadoop、Scala、Java、Docker 等,欢迎共同学习和交流。