storm trident 消息成功处理

trident里面

batch会被缓存,这样失败了可以重新发送

多个batch可以并行被process,但是commit是严格按照txid顺序来执行

一个batch的状态会存在zk里

只要batch在timeout时间内commit就算完成了,应该同时会清缓存

如果异常或超时了,就会replay

在原声的storm中一个tuple和它衍生的tuple有没有被成功处理,是通过一个异或机制来监控的,如果被成功处理,最后肯定会是0

batch也是类似的监控机制

一个batch也会衍生出一些tuple,也会通过groupby,来拆分进行process

一个tuple完成时说,它和它的衍生tuple,都ack成功了,

一个batch完成时说,batch里的所有tuple都成功了,这些tuple本身都是带txid标志的

一个batch中的多个tuple可能会被shuffle到多个partition,分别处理,这个是没关系的

一个window内可能包含多个batch,他们会被一起处理

storm里的处理实例:

worker:进程 jvm,一个worker有且仅为一个topology服务

executor:线程 ,一个executor处理一个节点(component),默认一个executor就处理一个task,也可以配置,循环处理多个task

task:待处理的任务,一个task,里面包含一些tuple,一个task只会交给一个executor来处理,发给同一个executor的taskid是固定的,只是tuple不一样 ?

task是传输的目标单元,会序列化和反序列化

group之后的数据,会放到一个task里交给一个线程来完成

batch,window,group内的数据,会放到一个task内进行处理

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容