今天由于外网打开a服务的时候超时了,猜测a服务已挂,但是登陆服务器之后没看到dump文件。有点难搞,目测挂掉不是oom这么简单,应该是操作系统层面的处理了(OOM killer:Out Of Memory killer)。
切换root,输入egrep -i -r 'killed process' /var/log
果然这几次都是被os给杀了。那么没有dump暂时没有办法。
由于已经开启了解释执行,现在怀疑2个点,一个是每次任务创建了新的class或者bean,没有回收(gc日志忘记看了,尴尬)。另一个还是需要看看dump文件才知道。为了能够在内存将满还未被os干掉之前手动dump,因此配置阿里云的告警: