在垃圾收集器之前,首先需要判断哪些对象存活,哪些对象已死(对象死亡的概念代表着,无论通过任何途径都无法访问该对象,无法被引用链可达)
引用
在Java中对于对于引用的概念有四种,分别是强引用、软引用、弱引用、虚引用。
- 强引用(Strongly Reference):传统的引用定义,如果reference类型的数据中存储的数值代表着另外一块内存的起始地址,就称该reference数据是代表某块内存、某个内存的引用。
- 软引用(Soft Reference):软引用用来描述一些还有用,但非必须的对象。只被软引用关联的对象在系统要发生内存溢出之前,会把这些对象列入回收范围之内进行二次回收,如果这次回收还没有足够内存,才会抛出系统异常。
- 弱引用(Weak Reference):强度比软引用更加弱一点,被弱引用关联的对象只能生存到下一次垃圾收集发生为止(无论当前内存是否足够)。
- 虚引用(Phantom Reference):也称为“幽灵引用”,这是一种最弱的引用关系,一个对象是否有虚引用存在,不会影响该对象的生命周期,也无法通过虚引用来获取该对象的实例。设置虚引用的唯一目的就是为了这个对象在被垃圾回收时收到一个系统通知。
引用计数算法
原理
引用计数算法基于一个不变式:当且仅持有某一对象的客户端集合不为空时,才能判断对象存活。在引用算法中,对象要与一个引用计数器相连,这个引用计数器一般在对象的头部槽中,当该对象被引用时,计数器加一,当引用失效时,计数器减一,当该对象的引用计数器为空或零时,这时便可将对象回收。
优缺点
优点:
1. 引用计数算法的内存管理开销分摊在程序运行过程中;
2. 某一对象成为垃圾便可以立即回收;
3. 可以持续操作即将满的内存,不需要预留空间;
4. 当应用程序确定某一对象并非共享对象的时候,可以直接进行破坏性操作,无需创建副本;
5. 引用计数算法无需运行时系统的支持,特别无需确定程序的根;
缺点:
1. 引用计数给赋值器带来了额外的时间开销;
2. 为避免多线程竞争可能导致对象释放过早;
3. 在简单的引用计数当中,哪怕最简单的读操作也需要引发一次内存写请求,这里的内存写请求会“污染”高速缓存,同时引起额外的内存冲突;
4. 引用计数算法无法回收环状引用结构;
5. 在某些极端情况下,对象的引用计数器所占有的空间开销非常大;
在高级的引用计数算法中可以解决部分问题,但是同时带来STW(Stop The World),这样就丧失了引用计数算法的优势
可达性分析算法
从判断对象是否死亡的角度出发,垃圾收集算法可以分为“引用计数式垃圾收集”和“追踪式垃圾收集”,而“追踪式垃圾收集”中有标记-清除(Mark-Sweep)、标记-复制(Mark-Copy)、标记-整理(Mark-Compact),这三种垃圾收集算法虽然处理方式各不相同,但是处理的第一阶段却是一样,追踪(trace)阶段,此阶段正是使用的可达性分析算法进行遍历和标记(Mark)。
原理
从根集合(Root Set)里面的每一个GC Roots的引用关系遍历GC堆的对象图,遍历的路径称为“引用链”,如果GC堆里面某个对象到Root Set没有引用链,就称为该对象不可达,对象已经死亡。类似如下图:
GC Roots
在Java体系里面,固定可以作为GC Roots的对象有如下几种:
- 在虚拟机栈(栈帧中的本地变量表)中引用的对象,譬如各个线程被调用的方法栈中使用到的参数、局部变量、临时变量等。
- 在方法区中类静态变量引用的对象
- 在方法区中常量引用的对象,譬如字符串常量池里的引用
- 在本地方法栈中JNI(Native方法)引用的对象
- Java虚拟机内部的引用,如基本数据类型对应的class对象
- 所有被同步锁(Syncharonized)持有的对象
- 反映Java虚拟机内部使用情况的JMXBean、JVMTI中注册的回调、本地代码缓存等。
优缺点
优点:
1. 可以解决环状引用;
2. 占用对象空间少,标记过程只需要在对象头设置标记位;
缺点:
1. STW(Stop The World),这是一个很严重的问题,目前来说,所有的追踪过程必须要STW;
JVM的执行过程
在JVM中判断一个对象是否存活,依旧要经历下面几个过程:
- 第一次标记:
当该对象进行可达性分析后,发现该对象不可达,将会对该对象进行第一次标记。 - 条件筛选:
在进行完第一次标记后,会对对象进行筛选,筛选条件是有没有必要执行finalize()方法,如果该对象没有覆盖finalize()方法,或者该对象的finalize()方法被执行过(任何一个对象的finalize()方法都只会被系统自动调用一次),则认为该对象可以直接回收。 - 加入队列:
在条件筛选完成之后,被认为不能直接回收的对象将会被加载到一个F-Queue的队列中。 - 执行方法:
在加入F-Queue之后,会有一条虚拟机自己建立的、低调度优先级的Finalizer线程去执行(触发)这些对象的finalize()方法,在finalize()方法中是这些对象存活的最后机会,只要和任意一条引用链连接上,都不会被回收。 - 第二次标记:
在执行完finalize()方法之后,收集器将会对F-Queue中没有与引用链关联上的对象进行二次标记。 - 对象回收:
对二次标记的对象或者在条件筛选判定为可以直接回收的对象进行回收。
本文参考《深入理解Java虚拟机》和《The Garbage Collection Handbook》这两本书