一.前言
我们平时发布服务端新版本时总会担心一个事情,就是发布时如果某些服务在运行,但因为发版服务器宕机了,而还没完跑完的服务刚好是很重要的业务,有时候会带来不可估量的损失,所以我们需要一个让服务安全关闭的方案,即保证等服务所有在完全跑完后才宕机。
二.背景
我现在负责这个项目,因为前期进度比较赶,所以队列(RocketMQ)消费整合到接口里面,消费使用线程池并发进行,但因为目前是初期运营,接口需要频繁发布,但队列的消费量也相当不小了(出于性能考虑,大部分耗时业务使用队列消费完成),所以没办法保证某些关键业务在接口发布时完整跑完,所以使用SpringBoot拆出一个专门进行队列消费的服务项目,但这样还是没有根本解决问题,因为队列消费项目也是需要发布的。
三.解决思路
为了所有服务都能完全跑完,首先我们要保证没有新的消费任务进来,所以在需要宕机时必须先保证消费者shutdown掉,然后再保证所有服务完全运行后宕机,但直接宕机会把所有在跑的线程结束掉,所以我们可以使用线程堵塞来实现接受到宕机信号后进行某些处理再完全宕机;
这时我们需要一个判断任务完全跑完的机制,这里我们创建一个专门计算任务的类,当队列任务任务消费进来时,我们把任务数+1,当任务执行完毕时我们任务-1,以任务数最终是否为0来进行判断所有任务是否完全跑完,因为队列消费是基于线程池执行的,所以我们需要保证计数的线程安全,这时候我们可以使用Java原生类库提供的AtomicInteger类来实现线程计数,AtomicInteger的计数具有原子性,有兴趣的小伙伴可以去研究一下。计数类具体代码如下:
我们需要引入一个钩子类方法,JDK1.3提供了Java.Runtime.addShutdownHook(Thread hook)方法,可以注册一个JVM关闭的钩子,这个钩子可以在一下几种场景中被调用:
程序正常退出
使用System.exit()
终端使用Ctrl+C触发的中断
系统关闭
OutOfMemory宕机
使用Kill pid命令干掉进程(注:在使用kill -9 pid时,是不会被调用的)
因为当jvm虚拟机关闭之前,会去调用addShutdownHook注册的线程钩子(需要在主线程实现),而我们的任务检测和线程堵塞可以在钩子方法里面进行。
四.后记
还有一个方案是通过捕获信号量来完成系统安全关闭,这个以后会进行更新;另外本篇该方案是关于系统所有服务完全关闭的,下篇会分享“在不影响其他服务的前提下进行系统某项子服务的安全关闭”。