GC是一个项目的一个重要的观察指标,什么时候gc,gc什么东西,如何gc都是需要了解的,以便能更好的support gc异常的问题
1.内存的回收算法
一种比较易想的算法是引用计数算法,什么时候我们认为对象可以被回收了呢,就是没有被引用的时候,最简单的方式就是加上引用计数,但是当出现相互引用的时候,也就是a引用b,同时b又引用a,那么通过这种算法是不能回收的,事实也证明了,这种情况是可以被回收的,也就是说我们所使用的并不是这一种算法。
java使用的内存回收算法是根搜索算法,简单来说就是所有的对象都向上追溯其被引用对象,当发现这条一个对象的引用链都没有根节点的时候,就可以回收该对象了。那么问题来了,什么样的对象可以称之为根对象,有如下四类
栈中的本地变量表引用的对象
方法区中static的对象
方法区中常量引用对象
Native方法(本地方法栈中的方法)引用的对象
对于相互依赖而言,虽然引用计数不为0,但是引用他的对象并不存在于方法栈,或者堆的方法区。也就是说引用他的对象都不是获得对象,所以要一起回收。
2.垃圾收集算法
(1)标记清除算法:这种算法就是将可回收的内存部分标记,并在搜索完之后将他们删除。算法复杂度简单,与之相对应的问题就是内存碎片化,有可能再被请求一片连续数据的时候,明明空间够,却要在进行一次gc。
(2)复制算法:这种算法被应用于新生代和survivor代中。刚才提到了清楚标记算法的缺点就是内存的碎片化,那么复制算法可以解决这个问题,他是将每次保留下来的内存资源copy一份,变成一片连续区域。这种算法应用于Eden和survivor代,首先因为新生代绝大部分都会在新的gc之后回收掉,所以没必要为copy区留很大的空间,一般是8:1:1,也就是说有90%的内存区域是可用的。当进行gc的时候,会讲幸存下来的对象内存区域copy到空的10%的survivor区,然后清空90%的另外两区,被清空的survivor区作为新的10%待copy区。不断循环往复下去。
(3)标记整理算法:老样子先总结一下复制算法的缺点,就是会浪费一部分空置的内存,而且还有一个问题,当存活率很高的时候,每次都要移动大量的数据,并不合适。所以需要另外一种解决碎片化的方案就是标记整理法,应用于老年带。当每一次gc的时候还是先标记要删除的内存区域,然后将所有保留区域的内存向一端移动,然后清除其他部分的内存。
(4)分代算法:也就是刚才例子中说到的eden survivor和old带,作为现在java内存回收的主要机制。
3.内存回收中其他要注意的问题
(1)当一次gc要保留的数据大于survivor的大小的时候要使用一种担保机制,就是让超出survivor的部分先进入老年代。
(2)一般来讲对象要长期存活并大于“年龄值”才能进入老年代,但是如果当survivor代的大于平均年龄的对象所占空间大于50%,那么提前将大于的这部分转移到老年代。
(3)新生代gc(minor gc)在新生带的gc,很频繁,“杀伤力很强”。老年代gc(major gc/full gc)当出现以下情况时会做full gc:老年代被写满,方法区被写满,调用system.gc()。当然担保的时候发现老年代满了也属于第一种。
4.一些参数的记录
(1)-XX:NewSize和-XX:MaxNewSize :用于设置年轻代的大小,建议设为整个堆大小的1/3或者1/4,两个值设为一样大。
(2)-XX:SurvivorRatio :用于设置Eden和其中一个Survivor的比值,这个值也比较重要。
(3)-XX:+PrintTenuringDistribution :这个参数用于显示每次Minor GC时Survivor区中各个年龄段的对象的大小。
(4).-XX:InitialTenuringThreshol和-XX:MaxTenuringThreshold :用于设置晋升到老年代的对象年龄的最小值和最大值,每个对象在坚持过一次Minor GC之后,年龄就加1。