搬砖不停,bug不断;一个注释造成的bug,万幸没有影响核心业务,否则别说年终奖了,这年头,就要说:拜拜了您嘞
bug现场
业务方反馈有线上问题,开发排查发现定时任务调度失败,查看xxljob控制台调度日志,一个时间点后的定时任务全部失败,如下图:
排查发现,定时任务已经断跑了几乎24小时,什么原因?
bug原因
经过分析,找到了bug点。导致bug的直接原因:一个小伙伴本地注释了xxx-job ConfigBean,并提交到远程分支上
bug解决
知道了原因后,那就赶快恢复分支,发布,问题解决;随着定时任务的恢复业务数据也正常了
bug影响
系统的所有定时任务没有按时执行,导致相关业务数据无法正常流转
bug复盘分析
1. xxljob告警配置 -飞书告警(至关重要)
2. 加强Code Review
3. 开发者的自我约束:对自己的代码负责
4. service和task拆分