背景
程序开发中设定了一个定时任务,任务执行时会去操作数据库。
问题
当部署了多个相应的应用时(假设不同ip), 多个应用就相当于多个进程,若多个进程同时触发定时任务,会造成资源浪费(同一件事情多个人干)、不可估算的错误(多个人同时操作数据库,比方说update)等问题
解决方案
创建一个多进程锁表t_process_lock,记录当前任务名name,应用服务的ip,更新时间updatetime(更新时间作为心跳依据)
针对自己ip
- 当定时任务触发时,检查表t_process_lock是否存在该任务名name,若不存在,则插入name、ip、updatetime 表示此ip已占用, 其他ip不允许访问
- 当定时任务触发时,检查表t_process_lock是否存在该任务名name,若存在,则检查表ip和自己服务的ip是否一致,若一致则更新updatetime,并执行任务。
针对其他ip的处理
- 当定时任务触发时,检查表t_process_lock是否存在该任务名name,若存在,则检查表ip和自己服务的ip是否一致,若不一致,则获取表数据的updatetime,跟数据库的当前时间now 做减法。 得到一个心跳间隔时间ping。 假设定时任务是10分钟进行一次,那么若ping>15分钟(因任务执行需要消耗时间,具体看程序耗时,本案例任务好耗时1分钟,允许5分钟降低误差), 则可以认为表ip已经挂了(或者宕机)
- 此时新ip可以插入name、ip、updatetime 表示新ip已占用, 其他ip不允许访问
ps: 若考虑到单进程多线程环境下, 只需要程序自己做熔断处理就可以了。 提示: 搞一个静态变量存储在内存中,区别任务是否正在执行。