概述
OOM:
- JVM一般都是先尝试GC,GC以后仍然无法腾出空间给新对象的时候才会针对对应线程触发OOM
- 另外OOM只是一个求救信号,JVM的一种自我保护机制,会自动停止导致异常的线程,但是不会导致整个应用的崩溃
- 触发OOM的原因:池子太小,对象太大(加载的东西太多、单个对象太大、无法及时释放资源)
- OOM的解决方案:(Perm、Heap) check内存配置、根据报错信息 或者 dump快照定位大对象的来源
OOM触发的几种情况:
- Heap不够:java.lang.OutOfMemoryError: Java heap space :设置 -Xms 来解决
- Perm不够:java.lang.OutOfMemoryError: PermGen space:加载了太多的类或者常量池太大了:设置-XX:MaxPermSize
- 栈区不够:(StackOverFlowError、java.lang.OutOfMemoryError: unable to create new native thread)
触发FGC的方法:
- 主动触发:System.gc()、命令触发(jmap -dump:live)、工具触发(jconsol)
- 老年代内存不足:真不足、预判不足、内存碎片、CMS 晋升失败、配置太小
- Perm区内存不足:加载太多的类、配置太小
OOM的排查
- 导致OutOfMemoryError异常的常见原因有以下几种:
- 内存中加载的数据量过于庞大,如一次从数据库取出过多数据,取了又无法释放,不能GC
- 集合类中有对对象的引用,使用完后未清空,使得JVM不能回收;
- 代码中存在死循环或循环产生过多重复的对象实体;
- 使用的第三方软件中的BUG;
- 启动参数内存值设定的过小
- OutOfMemoryError: PermGen space
- 问题分析: 加载了太多的类,比如第三方jar包。或者加载了太多的JSP。
- 解决方案: 增加java虚拟机中的XX:PermSize和XX:MaxPermSize参数的大小
- OutOfMemoryError: Java heap space
- 检查程序,看是否有死循环或不必要地重复创建大量对象。找到原因后,修改程序和算法。
- 增加Java虚拟机中Xms(初始堆大小)和Xmx(最大堆大小)参数的大小。如:set JAVA_OPTS= -Xms256m -Xmx1024m
- 常见代码引起的OOM的情况
- 检查代码中是否有死循环或递归调用。
- 检查是否有大循环重复产生新对象实体。
- 检查对数据库查询中,是否有一次获得全部数据的查询。一般来说,如果一次取十万条记录到内存,就可能引起内存溢出。这个问题比较隐蔽,在上线前,数据库中数据较少,不容易出问题,上线后,数据库中数据多了,一次查询就有可能引起内存溢出。因此对于数据库查询尽量采用分页的方式查询。
- 检查List、MAP等集合对象是否有使用完后,未清除的问题。List、MAP等集合对象会始终存有对对象的引用,使得这些对象不能被GC回收。
常用JVM异常排查手段
- 监控工具的使用,自带的JConsole、visualVM的使用
- 图形化显示 堆区内存变化、线程数、CPU使用等情况
- visualVM可以直接生成内存快照、线程快照,也可以直接帮你计算最大的20个Object
- 常用命令:
- jmap (-heap 查看堆区的配置信息)
- jstat(gcutil看即时的各个区域的变化情况、capacity查看容量情况)
gc日志分析(启动的时候设置参数,生成gc日志,然后用工具分析gc日志,比如FGC的次数、YGC的次数等信息)
快照分析(可以通过工具、命令、或者启动参数配置获取到快照,然后利用工具分析)
FullGC触发的情况
- 老年代空间不足:
- 真不足,新生代出来的对象进入老年代,而老年代的剩余空间不足
- 预判不足,统计得到的Minor GC晋升到旧生代的平均大小大于旧生代的剩余空间
- 连续不足,如果是CMS的话,即使内存剩余够。但是内存碎片太多,没有连续的内存装下原本可以装下的对象
- 紧急不足,CMS在Major GC的时候,因为是并发清除,未完成MGC时新垃圾产生,而剩余空间不足,也会触发FullGC,而且是以Serial Old单线程的形式执行。CMS的Major GC约等于FullGC的,因为一般都是YGC产生垃圾要进入老年代,而老年代又不足的时候才会触发MajorGC,这就是一个完整的FullGC啊。但是也不排除设置了大对象直接进入老年代,这样的话,可能没有YGC,就直接进入老年代触发MajorGC了
解决方案:调优时应尽量做到让对象在Minor GC阶段被回收
- 调大堆区的大小,默认MaxSize是总内存的1/4,初始值是1/64
- 代码里面,尽量不要有太大的对象产生,可以用分批读取,让该对象不直接进入老年代,而是被YGC回收掉
- 调大年轻代的大小
- 调大存活ratio,默认是15
Perm区满了:解决方案:调大Perm区的大小,或者代码中不要加载过多的class
代码调用 System.gc()。可以设置jvm参数,禁止程序调用这个方法。
jmap -histo:live pid 暴力GC,直接用命令
CMS的GC非常特殊,其它的SerialOld和Parallel Old回收器在老年代满了都是进行Full GC,而唯独CMS不是这样,CMS会定时检测老年代的占用比例,超过一定的比例就会触发老年代的GC。