240 投稿
收录了4篇文章 · 3人关注
  • Resize,w 360,h 240
    Spark之Spark Streaming原理

    一、Spark Streaming概述 Spark Streaming类似于Apache Storm,用于流式数据的处理,具有高吞吐量和容错能力...

    1.7 风之舟 0 15
  • Resize,w 360,h 240
    Spark SQL重点知识总结

    一、Spark SQL的概念理解 Spark SQL是spark套件中一个模板,它将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于H...

  • Resize,w 360,h 240
    Spark之RDD强化学习

    一、RDD依赖关系 1、RDD的依赖关系分为窄依赖和宽依赖;2、窄依赖是说父RDD的每一个分区最多被一个子RDD的分区应用,也就是它的出度为1;...

  • Resize,w 360,h 240
    Spark之RDD基础学习

    一、RDD概念 RDD(Resilient Distributed Dataset):弹性分布式数据集,Spark计算的基石,为用户屏蔽了底层对...

专题公告

关于spark相关知识的学习,希望大家多多支持!