登录注册写文章

Spark

Spark

spark

请说一下spark的RDD？
spark与RM的本质区别？
spark的任务调度过程？
自己实现一个RDD，需要实现那些函数或者部分
Spark中划分stage为什么以宽依赖为基准？
Spark中的DAGScheduler和TaskScheduler的区别及任务调度过程？
Spark中的stage必须要等所有父stage执行结束吗？
当上有stage关闭时，将数据存储在那里？
Spark的shuffle中的map输出结果的处理结构是什么？
说一下spark中的基本工作流程？
说一下spark的运行模式？
RDD是如何容错的？
reduce如何获取map任务的输出？
spark map端计算结果缓存处理并简介appendOnlyMap？
spark任务调度模块？
spark的存储管理？
spark的存储管理中的shuffle持久化？
说一下spark中的shuffle过程？
说一下spark中shuffle streaming？
说一下spark streaming？
说一下spark streaming如何处理反压？
说一下spark streaming支持的输入源有哪些？
spark streaming与spark作业的关系？
spark stream优化？
spark streaming 优点缺点？
spark hashPartitioner与rangePartitioner的实现？
spark RDD的内部数据结构以及不足？
spark join的几种形式？
spark streaming的容错处理？
spark stream 与 storm的区别？
spark中reparation与coalesce的区别？
用scala访问控制权限？（携程）
用scala实现worldcount？
spark中persist与cache的区别？
讲一下完整ETL的过程？
flume如何采集数据？
Tachyon？

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

冰解的破-spark
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AM...
大佛爱读书阅读 7,883评论 0赞 20
Spark 题
spark-submit的时候如何引入外部jar包在通过spark-submit提交任务时，可以通过添加配置参数...
博弈史密斯阅读 7,873评论 1赞 14

spark大数据架构初学入门基础详解
Spark是什么 a)是一种通用的大数据计算框架 b)Spark Core离线计算 Spark SQL交互式查询 ...
Alukar阅读 5,946评论 0赞 19
spark大数据架构初学入门基础详解
Spark是什么 a)是一种通用的大数据计算框架 b)Spark Core离线计算 Spark SQL交互式查询 ...
三万_chenbing阅读 7,172评论 1赞 17
Apache Spark 2.2.0 中文文档 - Spark Streaming 编程指南 ...
Spark Streaming 编程指南概述一个入门示例基础概念依赖初始化 StreamingConte...
Joyyx阅读 10,846评论 0赞 26

友情链接更多精彩内容

赞1赞

赞赏

手机看全文