IP属地:北京
Spark BlockManager原理与源码分析yarn的框架及原理Spark数据倾斜的完美解决SparkSQLAndDataFrames对结构化数据集与非结构化数据的处理...
一、简介 Apache Kafka是分布式发布-订阅消息系统,在 kafka官网上对 kafka 的定义:一个分布式发布-订阅消息传递系统。 它最初由LinkedIn公司开发...
RDD-DataFrame 上图直观地体现了DataFrame和RDD的区别。左侧的RDD[Person]虽然以Person为类型参数,但Spark框架本身不了解Person...