论文&翻译 RDD 弹性分布式数据集:一种基于内存的集群计算的容错性抽象方法 原论文 博客 如何学习 Spark? - 王知无的回答 - 知乎 RDD、DataFrame和DataSet的区别 子雨大数据之Spark入门教程(Python版) 且谈 Apache Spark 的 API 三剑客:RDD、DataFrame 和 Dataset