>微信公众号:百℃水温如有问题或建议,请公众号留言###引言
在企业应用中,Kafka是一个非常受用户青睐的开源产品,随着产品研发的逐步成熟,其应用的领域也越来越广泛,例如:企业各类信息归集(日志)、大数据流处理平台、基于队列的顺序存储、基于消息事件应用系统的构建等方面,都是Kafka大展身手的地方,同时伴随其生态产品日渐丰满,让各类应用用户使用时更加得心应手;但同时可能由于Kafka自身的坑、研发对系统理解不够或逻辑处理不当,在开发阶段存在一定瑕疵,造成生产系统故障的惨痛经历。本文也是总结公司在使用Kafka过程中遭遇到的诸多问题,并不断修正和完善系统过程中获得的一些思考和实践。
本文重点是从利用Kafka平台构建事件驱动应用系统的角度,来阐述怎样实现业务上的高可靠、高可用场景;涉及高可靠和高可用场景,话题通常很大,并非本文所能涵盖;这里将从消费过程进行阐述:在Kafka消费环节出现异常后,如何优雅解决业务中的共性问题,提供统一有效的处理方式去帮助业务开发摆脱繁琐的设计和复杂的实现。
在Kafka消费逻辑中,开发人员经常要面对各类执行异常的处理,比如:1. 消息消费时,调用下游服务失败后如何处理该消息,立刻重试还是先缓存后期如何处置;2. 本地重试,重试频率怎么选,是否需要丢弃策略,丢弃的消息是否有告警和能否追溯等问题;3. 若采用缓存方式,是本地缓存,还是集中式缓存;消费实例的failover机制能否恢复消息数据;4. 重试机制是否会导致消费堵塞,引起系统吞吐的下降;消息的同步重试常会带来性能的退化,如果业务采用异步处理,线程的复杂度以及消费进度的管理又成为棘手的难题;6. 异常消息的保存问题;一直消费失败的消息,可能协议解析或者特定服务故障引起,从而造成反复重试失败,对于此类消息需要持久化保存,以方便问题的排查和补偿使用,而且不同应用的死信消息也要进行应用间的隔离;
以上列举了消费过程中经常发生的各类异常问题,本文将从这些方向着手详细讨论如何从消息组件角度来优雅的解决此类问题;保证消息可靠消费的同时,尽可能优化性能吞吐,提升系统的并行处理能力和异常failover处理机制。
###目前现状遇到消息处理失败时,常见的处理方式:1. 直接进行消息的本地重试,确保消息处理成功,否则阻塞的方式进行重试直至成功为止;处理逻辑简单,无需过多的业务代码;但是会影响系统吞吐,增加平均延迟时间。2. 完全交由业务来处理,比如后期审计对账的方式,有遗漏的或未执行成功的,统一调度进行补偿;消费逻辑里无需考虑失败状态,直接丢弃并继续后面的消费。3. 消费失败的消息,进行本地保存或者远程存储(如数据库等),消息状态置为消费失败,不影响后续消息的执行;在本地或远程服务内设专门的定时任务来处理异常的消息,进行消费补偿(例如:消费失败直接发回到特定的topic,由后台服务来进行处理); 该方式稍微复杂需要考虑本地或远程存储逻辑(确保消息的持久化),以及处理消息重新投递的问题。4. 利用消息系统自身的存储能力,建立该消费组的重试队列(不同于原消费队列),当遇到消费失败的情况,发送至重试队列,并继续消费后续的消息;消费者订阅消费队列时,默认订阅该组的重试队列,保证进入重试队列的消息后续能继续正确投递给消费者。
目前,大致有以上几种方式来处理消费异常的情况,我们在调研现有开源产品和业务需求时,充分考察了各种处理方式的优缺点,综合各类消息异常处理的共性问题,基于kafka1.0引擎设计了适合本公司常见应用场景的一套重试方案来满足业务上的需求。
***版本号:V2.0.2更新日期:2017-11-241. 解决“一键排版”中一些全局样式无效的情况2. 增加“一键排版”更多的样式,并开放了所有的css样式供你修改注:会重设所有的样式,你之前保存的会无效。3. 把之前保存到cookie中的一些内容保存到local stage下,避免4KB的限制4. “复制"内容到csdn,博客园时,不再需要点选HTML***版本号:V2.0.1更新日期:2017-11-201. 解决代码块加注释'//'时导致后面的highlight失效的问题2. 只有html模式时才把空格转为转义字符;***版本号:V2.0.0更新日期:2017-11-131. 增加css样式参考模板,及自定义css样式2. 增加HTML源码功能,可把HTML源码直接“复制"/"粘贴”到 csdn、博客园等的html编辑器或富文本编辑器下的html中,这样能保持所有的样式3. 增加编辑和预览的滚动条同步滚动的功能(现在还不是很精确,之后会再改善)4. 增加favorite代码样式下少的一些属性5. 增加选“编辑”后,自动保存草稿到本地浏览器缓存的功能。6. 增加指定代码所属语言的示例***版本号:V1.0.4更新日期:2017-10-201. 更新“代码主题”:favorite下对js和css的显示2. 更新“代码主题”:monokai-sublime和monokai中漏的一些属性3. 更新说明文档***版本号:V1.0.3更新日期:2017-10-181. 把“代码紧凑”模式下的代码间的行距加大***版本号:V1.0.2更新日期:2017-10-171. 增加一个很酷的“代码主题”:favorite,并作为默认主题2. 增加“代码紧凑” 的选项,使手机一屏能显示更多的代码***版本号:V1.0.1更新日期:2017-10-131. 第一个版本正式上线***我是页内跳转到的位置[^10]: 注脚跳转位置