Java和C/C++的区别之一就是自动管理内存,即自动分配和回收内存。在程序员不能自己管理内存的情况下,理解Java如何回收内存将有助于提高编码质量。随着一个程序的运行,程序产生的对象、变量等信息将不断消耗有限的内存,及时回收内存不仅可以保证内存正常运行,还可以提高系统性能。本文将围绕以下问题探讨Java垃圾回收:
- 哪些内存区域可以进行垃圾回收?
- 如何确定一个对象是否可以回收?
- 垃圾回收算法概览
1. 哪些内存区域可以进行垃圾回收?
在Java虚拟机中共分五个区域,分别是线程私有的程序计数器、Java虚拟机栈、本地方法栈和线程共享的堆和方法区。线程私有的内存区域不需要进行垃圾回收,因为随着线程的运行结束,它门占用内存自然就被释放了。因此只有线程共享的堆和方法区需要进行垃圾回收。
确定了需要进行垃圾回收的内存区域,下一个问题就是Java如何确定哪些对象是可以回收的呢?
2. 如何确定一个对象是否可以回收?
我们都知道当一个对象不再被需要的时候就可以进行垃圾回收,在Java中确定一个对象是否可以被回收有如下两种方法。
2.1 引用计数器算法
每个对象都会包含一个引用计数器,当对象被引用一次,计数器加1;当对象失去一个引用,计数器减1。当计数器在一段时间内保持为0时,该对象就被虚拟机认为是可回收的。
-
算法缺点
- 无法回收循环引用的对象:当两个对象互相引用时,二者就都不会被回收,因为计数器永远不会为0。当两个对象没有任何作用时,这部分内存依然被占用无法回收。
-
算法优点
- 实现简单,效率较高。
2.2 GC Roots根搜索算法
根搜索是通过一些“GC roots”对象作为起点,从这些节点开始往下搜索,搜索通过的路径则成为引用链(Reference Chain)。当一个对象没有被GC Roots的引用链连接的时候,则表明该对象没有任何引用,可以被回收。什么是GC roots呢?GC roots是被JVM引用的对象,因此GC roots可以保证其他被引用的对象不被JVM回收。
GC Roots对象包括:
- 虚拟机栈(栈帧中的本地变量表)中的引用对象
- 方法区中的静态类或属性引用的对象
- 方法区中常量引用的对象
- 本地方法栈中JNI(Native方法)的引用对象
了解了JVM是如何确定一个对象是否可回收之后,下一步则是JVM是如何回收这些对象的。
3. JVM垃圾回收算法概览
3.1 标记-清除算法(Mark-Sweep)
标记清楚算法分两个阶段:“标记”和“清除”。首先,JVM将可以回收的对象进行标记,之后对所有对象进行扫描,将有标记的对象进行回收。
- 算法缺点
算法效率不高,并且在清理完成后会产生内存碎片。清理完成后,如果有大对象需要连续的内存空间时,还需要进行碎片整理。 - 可视化
-
标记
-
清理
-
3.2 标记整理算法(Mark-Compact)
与标记清理算法类似,都是标记回收。但是标记整理算法在清理之后会将依然存活的对象移动到一起,这就使得内存得以连续。
- 算法优点
标记整理算法可以提高内存使用效率,因为在内存整理之后,当程序需要为新对象分配空间时就无需在内存碎片中搜索大小合适的碎片。 - 可视化
-
整理
-
3.3 复制算法(Copying)
复制算法将要进行垃圾回收的内存分成不同的模块。当在A内存模块中进行垃圾回收时,将存活的对象复制到B内存模块,然后清理A内存模块。
算法优点
算法实现简单,运行效率高。算法缺点
由于每次只能使用其中一部分内存,导致内存利用率不高。-
可视化
-
Copy
-
4. 总结
很多文章把分代收集(Generational Collection)也列为了一种垃圾回收算法,个人并不认同,因为分代收集只是垃圾回收算法的应用。比如在HotSpot虚拟机中共有新生代、老年代和永久代,在不同的分代中使用不同的垃圾回收算法。不同的分区适用不同的算法:
- 新生代:复制算法
- 老年代:标记整理算法
- 永久代:标记整理算法
Oracle在Java Garbage Collection中详细介绍了不同的分区如何使用不同的垃圾回收算法,同时也介绍了对象如何从新生代不断迭代进入永久代的。
除此之外,垃圾回收器也是垃圾回收中重要的一部分。常见的垃圾收集器有:
- 串行GC (Serial GC)
- 并行回收GC (Parallel Scavenge)
- 并行GC (ParNew GC)
不同的垃圾回收器可以通过不同的命令来指定使用,例如:
- -XX:+UseSerialGC
- -XX:+UseParallelGC
等等。