记一次异常FullGC的问题排查

最近在排查服务JVM的FullGC超过1s的问题。查证后发现并不是Old Gen空间不足时导致的GC，而是其他情况导致的FullGC。可能导致FullGC的原因有以下几种。

老年代空间不足。

永生代或者元数据空间不足。

System.gc()方法调用。

CMS GC时出现promotion failed和concurrent mode failure

YoungGC时晋升老年代的内存平均值大于老年代剩余空间

有连续的大对象需要分配

老年代空间不足条件已经被排除，代码中没有System.gc()方法的调用，且老年代空间充足，每次YoungGC晋升老年代的内存并不多，也没有大对象需要分配。排查了一轮之后，发现只可能是永生代或元数据空间不足引起的FullGC。由于我的项目中使用的是1.8，所以Jvm中类信息、常量、静态数据等存放在元数据空间中（MetaSapce）。观察我的MetaSpace已经达到200MB，超过了我设置的离我设置的-XX:MetaspaceSize=128m的大小,距离设置的最大最数据空间大小-XX:MaxMetaspaceSize=256m也已经很接近了。

MetaSpace与Perm不同，在创建之初只分配一个很小的内存，当类不断加载时才会持续扩容，当MetaSpace较大时，可能导致频繁的FullGC，且当MetaSpace超出预设的最大值时，有可能导致OOM。

由于MetaSpace区域存放的是Jvm中类信息等，在正常情况下不会有这样大量的增长。定位问题之后发现，是下面的一段bean的配置引起的：

<bean id="testMetaSpaceOOM" class="TransactionManager"
      scope="request" factory-method="createProxy">
    <constructor-arg name="target" type="Class" value="test.TestMetaSpaceOOM"/>
</bean>

这个配置是为了使类中的方法可以实现事务，createProxy方法如下：

public Object createProxy(Object target) {  
        this.obj = target;  
        Enhancer enhancer = new Enhancer();  
        enhancer.setSuperclass(this.obj.getClass());
        enhancer.setCallback(this);
        enhancer.setClassLoader(target.getClass().getClassLoader());  
        return enhancer.create();  
    }

而这个对象的scope是request，也就是说每个请求进来，都会重新通过Enhancer动态创建了给定类型的子类，所以随着请求的不断进入，这个动态类的类文件就越来越多，导致频繁的FullGC。查询VisualVM可以发现，服务中这个类的动态生成类不计其数：

dump-TestMetaSpaceOOM的动态生成类

问题及时发现，将scope修改为singleton或者修改构造函数避免动态类的不断生成即可，可以示具体情况选择方案。

MetaSpace持续增长导致FullGC执行了1000多次

但是当真的当MetaSpace超过指定的最大值时，是立即发生OOM，还是先执行一次FullGC，再发生OOM，于是我在本地测试了一次。垃圾回收器是ParNew+CMS。测试结果是当MetaSpace超过预先设置的最大值时，会触发FullGC，FullGC之后可能会有几条新的请求可以被执行，但是依然无法避免之后发生OOM，OOM会迟到，但是不会缺席。

记一次异常FullGC的问题排查

推荐阅读更多精彩内容