登录注册写文章

sparkStreaming读取kafka中数据时，如何有效的对offset进行手动维护

sparkStreaming读取kafka中数据时，如何有效的对offset进行手动维护

在spark streaming读取kafka的数据中，spark streaming提供了两个接口读取kafka中的数据，分别是KafkaUtils.createDstream，KafkaUtils.createDirectStream.
KafkaUtils.createDstream自动把offset更新到zk中，默认会丢数据，效率低；KafkaUtils.createDirectStream不会使用zk来存储offset，需要自己手动维护offset，可以把offset存储在MySQL等关系型数据库或者HBASE上面。

这个问题答案不太好，需要再好好考虑下。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

大数据学习笔记1000条
Zookeeper用于集群主备切换。 YARN让集群具备更好的扩展性。 Spark没有存储能力。 Spark的Ma...
Yobhel阅读 7,631评论 0赞 34
spark向kafka写入数据(转)
前言在WeTest舆情项目中，需要对每天千万级的游戏评论信息进行词频统计，在生产者一端，我们将数据按照每天的拉取...
生活的探路者阅读 2,240评论 0赞 6

2018-09-14 Spark Streaming 实时计算在甜橙金融监控系统中的应用及优化
来源：https://mp.weixin.qq.com/s/Kv1Qq4118I2itYwPYyQUoA 1写在前...
四火流年阅读 1,639评论 0赞 7
那个及时行乐的人后来怎么样了？
同事A，因为拖欠贷款被银行联合政府发了行政通告，如果还不清欠，下月将被起诉到法院。说到A，就是典型的活撇子，满嘴跑...
四叶草_广广阅读 970评论 8赞 10
纯粹BB叨
反DISS-1: 没有灭私从义的命，就去做等价交换的事董明珠曾经说过一句话：当人存着私心做一个决定、做一件事的...
三十岁的老少女阅读 232评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文