Kafka Note（八）消息顺序健壮机制

（八）kafka消息顺序健壮机制

消息顺序写入的定义
- 仅保证每个partition内的messages是顺序的。
- 基于向partition写入数据是以append的模式追加的，故而可以确保其顺序性。
- 不保证topic维度下的全部顺序。
保障顺序消费的手段
- producer需要保证相关消息写入同一个partition，以次保障顺序，比如一个订单下的多条消息需要进入同一个partition。
- broker可利用只创建一个partition来强制保证，但此举会严重损失吞吐能力。
- consumer需保证一个线程消费一个partition的对应关系，注意如下问题：
  - 单线程时，消费顺序必然是顺序的，但是消费能力不足导致消息积压；
  - 多线程时，避免消息直接被扔入pool，把消息根据策略放入内存队列中，队列下游用单线程方式拉取消费。基本策略有两种，record.partition() & record.key()，前者拿到分区id，丢入对应的内存队列；后者拿到上游设置的key，hash后丢入对应的内存队列。

常见策略
- 基于DB唯一键：消息内容拼成唯一key。创建幂等表，就两列id & key。
- 基于缓存：判断key是否在缓存中，若在缓存就跳过，不在则存入后处理。
常见场景
- producer遇到网络抖动，broker已经写入数据，但producer以为自己超时重发了信息。
- consumer若一次拉取500条messages，业务处理了200条，虽然consumer自己down了（未提交消费位移200），那么原来的200会被重复消费。

最后编辑于：2022.10.09 22:03:12

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。