学习JVM垃圾回收机制主要学习以下几点:哪些内存需要回收(判断对象可以回收)、什么时候回收(GC什么时候执行)、怎么回收(垃圾回收算法、垃圾回收器)、垃圾回收过程。
JVM GC回收哪些区域内的垃圾?
JVM GC只回收堆区和方法区内的对象,不回收虚拟机栈内的数据,栈内数据在超出作用域后会被JVM自动释放掉。
因为JVM GC回收堆区的对象,所以先了解学习一下堆内存的结构图:
堆内存分为年轻代(Young Generation)、老年代(Old Generation),年轻代和老年代所占空间比例默认是1:2。年轻代又分为Eden和Survivor区,Survivor区由FormSpace和ToSpace组成。Eden区占大容量,Survivor两个区占小容量,默认比例是8:1:1。From和To主要是为了解决内存碎片化。
JVM GC怎么判断对象可以回收?
- 对象没有引用。
- 作用域发生未捕获异常。
- 程序在作用域正常执行完毕。
- 程序执行了
System.exit()
。 - 程序发生意外终止(被杀进程等)。
判断对象是否可以回收涉及到垃圾回收算法,后面我们会详情说明。
有些时候我们可以把相关的对象设置成null来试图显示的清除缓存,但是并不是设置null就一定被标记成可以回收,比如以下代码:
public static void testGC() {
ReferenceCountingGC objA = new ReferenceCountingGC();
ReferenceCountingGC objB = new ReferenceCountingGC();
objA.instance = objB;
objB.instance = objA;
objA = null;
objB = null;
// 假设在这行发生GC, objA和objB是否能被回收?
System.gc();
}
把objA
和objB
设置null不会被标记成可以回收因为objA
和objB
循环依赖引用关系,但是System.gc();
会执行Full GC
回收。
将对象设置null至少没有什么坏处,但是System.gc();
便不可取了,因为使用System.gc();
的时候并不是马上执行GC操作,而是会等待一段时间,甚至不会执行,如果被执行会触发Full GC
是非常影响性能的。
JVM GC什么时候执行?
Eden区空间不够储存对象的时候会执行Minro GC
。升到老年代的对象大于老年代剩余的空间时执行Full GC
,或者小于的时候被HandlePromotionFailure
参数强制Full GC
。JVM GC调优主要是减少Full GC
的触发次数,可以通过设置参数NewRatio
控制年轻代和老年代所占内存比例,通过设置参数MaxTenuringThreshold
改变对象进入老年代的阙值。Full GC
非常损耗性能,执行时间大概是Minro GC
的10倍。
JVM GC按代的垃圾回收机制
年轻代:绝大多数新创建的对象都是被分配在年轻代(对象很大的话可能被分配在老年代),年轻代触发GC对象被回收的过程称之为Minor GC
。
老年代:对象在年轻代周期存活了下来,会被拷贝到老年代,老年代触发GC对象被回收的过程称之为Full GC
。
持久代:也被叫做方法区,用于保存类加载信息、常量、静态变量等,方法区不是用于储存老年代存活下来的对象,这个区域也可能发生GC,方法发生GC的过程被称为Major GC
,方法区发生GC的条件非常苛刻,必须满足以下三个条件才会回收:
- 所有实例被回收。
- 加载该类的ClassLoader被回收。
- Class对象无法通过任务途径访问(包含反射)。
老年代如何解决引用年轻代对象问题?
老年代中存在一个card table
,大小为512字节,用于存放所有老年代对象执行年轻代对象的引用,当针对年轻代执行GC的时候,只需查询一下card table
来决定是否回收,而不同查询整个老年代。
垃圾回收过程
- 绝大数刚刚新建的对象都会储存在年轻代的Eden区。
- 当Eden区空间不足时就会执行GC,在执行第一次GC之后存活的对象就会移动到Survivor的From区。
- 此后每次Eden区执行GC,存活的对象都会被存放在From区。
- 当From区空间饱和时,在存活的对象就会被移动到to区,然后清空from区。
- 在以上步骤重复N次(N=MaxTenuringThreshold 年龄阙值默认15)依然存活的对象就会移到老年代,如果这个时候老年代没有空间了就会触发
Full GC
,如果触发 Full GC之后空间还是不足就会抛出OOM异常。
JVM GC核心参数
-XX:NewRatio
–XX:SurvivorRatio
–XX:NewSize
–XX:MaxNewSize
-XX:NewRatio
表示年轻代和老年代相对的比例,比如-XX:NewRatio=2
表示老年代是年轻代的2被,老年代占堆的2/3,年轻代占1/3。
-XX:SurvivorRatio
表示年轻代里面Eden区和Survivor区相比比例,比如-XX:SurvivorRatio=8
表示Eden:From:To = 8:1:1
。SurvivorRatio不能设置过大也不能设置过小,一般默认值即可。
-XX:NewSize
表示年轻代的初始化大小。
-XX:MaxNewSize
表示年轻代最大大小。
JVM GC算法
根搜索算法
程序把所有引用关系看作一棵树,从一个根节点GC ROOT开始寻找对应的引用节点,找到这个节点后继续寻找这个节点的引用节点,当所有节点寻找完毕之后,没有被引用的节点就是无用的节点。
上图红色就是无用的节点,可以被回收。
目前Java中可以作为GC ROOT的对象有:
- 虚拟机栈、本地方法栈中引用的对象,对象分别是本地变量表、Native对象。
- 方法区中静态变量、常量引用的对象。
标记-清除算法
标记-清除算法采用从根集合进行扫描,对存活的对象进行标记,标记完毕之后再扫描整个空间中未被标记的对象进行回收。
标记-清除算法不需要进行对象的移动,并且仅对不存活的对象进行回收,在存活的对象比较多的情况下极为高效,但是由于标记-清除算法直接回收不存活的对象,没有对还存活的对象进行整理,所以会导致内存碎片化。
复制算法
复制算法将内存空间划分为两个区间,所有对象都只会分配在其中一个活动区间,而另外一个区间则是空闲的。
复制算法采用从根集合扫描,将存活的对象复制到空闲区间,当扫描完毕之后,会将活动区间一次性回收,此时原本的空闲区间变成了活动区间,下次GC的时候又重复此操作。复制算法在存活对象比较少的时候极为高效。
标记-整理算法
标记-整理算法采用标记-清除算法一样的方式进行对象的标记、回收,但是在回收不存活对象占用的空间后,会将所有存活的对象往左移动,并更新对应的指针,解决了内存碎片的问题。
JVM为了优化内存的回收,使用分代回收的方式,年轻代内存回收采用复制算法,老年代回收大多采用标记-整理算法。
垃圾回收器
年轻代回收器
Serial:
- 算法:复制算法
- 说明:简单高效的单核机器,Client模式下默认的年轻代收集器。
ParNew
- 算法:复制算法
- 说明:Serial的多线程版本,运行在Server模式下的JVM首选的新生代收集器。
Parallel Scavenge
- 算法:复制算法
- 说明:又被称为吞吐量优先收集器,和ParNew 收集器类似,目标在于达到可控制吞吐量。
老年代回收器
Serial Old
- 算法:标记-整理算法
- 说明:性能一般,单线程版本,在JDK1.5及之前的版本中与Parallel Scavenge收集器搭配使用,作为CMS收集器的后备预案。
Parallel Old
- 算法:标记-整理算法
- 说明:GC多线程并行,为了替代 Serial Old 与 Parallel Scavenge 配合使用。
CMS
- 算法:标记-清除算法
- 说明:对CPU资源敏感,停顿时间长。会产生内存碎片,可以通过参数开启碎片的合并整理。 基本已被 G1 取代。
年轻代、老年代共用回收器
G1
- 算法:标记-整理算法
- 说明:新的垃圾回收器,既可以回收新生代也可以回收老年代,适用于多核大内存机器、GC多线程并行执行,停顿低、高回收率。