登录注册写文章

Spark错误容忍机制

Spark错误容忍机制

spark的错误容忍机制有两种方法。

① 通过重新执行计算任务来容忍错误。当job抛出异常不能继续执行时，重新启动计算任务，再次执行。

②通过checkpoint(检查点)机制，对重要的中间数据进行持久化。

检查点（本质是通过将RDD写入Disk做检查点）是为了通过lineage（血统）做容错的辅助，lineage过长会造成容错成本过高，这样就不如在中间阶段做检查点容错，如果之后有节点出现问题而丢失分区，从做检查点的RDD开始重做Lineage，就会减少开销。

设置checkpoint的目录，可以是本地的文件夹、也可以是HDFS。一般是在具有容错能力，高可靠的文件系统上(比如HDFS, S3等)设置一个检查点路径，用于保存检查点数据。

分别举例说明：

本地目录

注意：这种模式，需要将spark-shell运行在本地模式上

HDFS目录

注意：这种模式，需要将spark-shell运行在集群模式上

源码中的一段话

最后编辑于：2021.10.11 23:53:51

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

Spark从入门到精通16：RDD的容错机制
在执行一个含有多个RDD算子的Spark程序时，如果执行过程中的某一步计算失败了怎么办呢？重头再计算一遍的话无疑成...
金字塔下的小蜗牛阅读 564评论 0赞 0
Spark-Core
目录一.什么是Spark？1.什么是Spark？2.为什么要使用Spark？3.Spark的特点：快、易用、通用、...
Movle阅读 265评论 0赞 6
Spark-core：Spark的算子
目录一.RDD基础1.什么是RDD2.RDD的属性3.RDD的创建方式4.RDD的类型5.RDD的基本原理二.Tr...
Movle阅读 1,180评论 0赞 2
Spark--Spark RDD的容错机制lineage与checkpoint
Attention Please--文章来自互联网资料整理，如有雷同，纯属李小李抄袭，如有侵权请联系删除 From...
李小李的路阅读 2,566评论 0赞 2
Spark之RDD强化学习
一、RDD依赖关系 1、RDD的依赖关系分为窄依赖和宽依赖；2、窄依赖是说父RDD的每一个分区最多被一个子RDD的...
风之舟阅读 379评论 0赞 1

赞1赞

赞赏

手机看全文