- 垃圾回收三件事情需要解决:那些需要回收,什么时候回收,怎么回收
2. 判断对象是否存活
2.1 引用计数法:需要占用一些额外的空间,为每个对象配置一个引用计数器,判断有多少对象引用当前对象,但是存在问题就是存在循环引用的问题,造成内存泄漏。
2.2 可达性分析法:每次从需要回收区域以外的区域的对象集合作为GCroot进行查找,与该root相连的对象组成引用链,之外的对象则是没有被引用到的对象,但是这里不是没有引用的对象就是被回收,而是判断没有被引用的对象是否重写finalize方法或者是否执行过finalize方法,将没有执行过finalize且重写finalize方法的对象加入F-Q队列之中,启动线程Finalize去执行它们的finalize方法,只是保证执行,但是不一定执行完毕,因为可能在该方法中存在死循环,从而可能造成垃圾回收奔溃。如果执行完毕还是没有引用则该对象已经死亡。
引用的分类
强引用:就是我们平时所创建对象时候用的引用,无论何种情况下,只要引用存在就不会回收。
软引用:当内存不足的时候,该引用指向的对象会被回收
弱引用:执行存活一个垃圾回收的区间,不管内存够不够,当进行垃圾回收的时候就会将弱引用执向的对象进行回收
虚引用:最弱的引用,存在意义只是在垃圾回收时候收到一个系统通知
3. 垃圾回收算法
3.1 标记清除:先对对象进行标记,然后对垃圾进行清楚,这种算法没有内存规整。
3.2 标记复制:先对对象进行标记那些可回收,那些不可回收,然后将存活的对象复制到另一边空闲的内存区域,这个算法适合于对象朝生夕死的时候,这个算法会对内存有要求,即每次需要一片空闲的区域来存放垃圾回收之后存活的对象。在新生代的内存回收一般使用此种算法。
3.3 标记整理:将对象先进行标记,然后将存活的对象移动到内存的一端,然后清理另一端的内存,这种算法一般常用于老年代的回收。
3.4 根节点枚举
在标记阶段,在hotSpot中,使用的可达性分析算法,这就要求需要先找到GC Root的集合然后,以此集合为起点进行标记。寻找GC Roots集合也是费时的,需要STW。HotSpot提供了优化方案就是OopMap这种数据结构,这个数据结构知道那些地方是引用,在编译过程中即可确定,这样收集器扫描的时候就直接可以确定了,并不需要从一些区域全部扫描。
安全点:可以理解为对象的引用在这个时刻不发生变化,解决的即是在何时进行垃圾回收的问题。在发生垃圾回收的时候,需要所有线程都要跑到最近到达安全点,有两种方案:
①抢先式中断:将所有的线程直接先中断,如果发现有的线程不在安全点上的时候就重新恢复他,让他跑到安全点上。
②主动式中断:当需要进行垃圾回收的时候不对线程直接操作,而是设置一个标记位,线程就不断轮询去检查这个标志,如果为真就在跑到离自己最近的安全点停下来。
安全区域:在线程没有获得CPU时间片的时候不能进入安全点,就可能加长等待时间,所以出现安全区域,在这个区间内都可以进行垃圾回收,在出区间的时候检查垃圾回收是否完成,如果完成则继续执行,否则等待垃圾回收。
3.5 记忆集与卡表
也是为了优化查找GC root集合的效率。
(1)记忆集:可以看做是一种记录从非收集区域指向收集区域的指针集合的抽象数据结构
(2)卡表:记忆集的一种实现,卡表就是一个字节数组,每个元素都可以看做标识着一块内存区域,如果该内存区域有跨代指针,则标识为1,称为这个原味变脏。
卡表的维护:即何时将元素变脏,以及谁来变脏,HotStop是通过写屏障来实现的,写屏障可以看做是虚拟机层面对引用字段赋值的AOP切面,在环绕通知的时候进行卡表的相关维护。
3.6 并发的可达性分析
三色标记法:
白色:表示未被垃圾回收器扫描过的对象。
灰色:表示被扫描过但是该对象还存在至少一个引用对象没有被扫描
黑色:所有对象都被垃圾回收器访问过。
在用户线程与垃圾回收线程并发的情况下,可出现问题白色的对象被标记位其他颜色,即原本要回收的对象被标记位不可回收,这种情况影响不大,下次在回收即可,另一种情况是:黑色变为白色,原本不能回收的对象被回收。
(1) 黑色被误标为白色的解决方法
增量更新:当黑色对象插入新的执行白色对象的关系时候,将这个更新记录下来在进行扫描。
原始快照:当灰色对象删除执行白色对象的关系时候,删除记录下来,再进行扫描。