一、Spark Streaming概述 Spark Streaming类似于Apache Storm,用于流式数据的处理,具有高吞吐量和容错能力...

收录了4篇文章 · 3人关注
一、Spark Streaming概述 Spark Streaming类似于Apache Storm,用于流式数据的处理,具有高吞吐量和容错能力...
一、Spark SQL的概念理解 Spark SQL是spark套件中一个模板,它将数据的计算任务通过SQL的形式转换成了RDD的计算,类似于H...
一、RDD依赖关系 1、RDD的依赖关系分为窄依赖和宽依赖;2、窄依赖是说父RDD的每一个分区最多被一个子RDD的分区应用,也就是它的出度为1;...
一、RDD概念 RDD(Resilient Distributed Dataset):弹性分布式数据集,Spark计算的基石,为用户屏蔽了底层对...
专题公告
关于spark相关知识的学习,希望大家多多支持!