垃圾回收指的是回收"已死"的对象,"已死"代表该对象不可能被任何途径使用
判断对象已死的几个算法
1. 引用计数法
给对象一个引用计数器,每当有一个地方引用它时,计数器加1;当引用失效时,计数器减1;任何时刻计数器都为0时代表该对象不可能被使用
优劣:
实现简单,判定效率高,但是很难解决对象之间相互循环引用的问题
2.可达性分析
通过一系列的“GC roots”的对象作为起点,从这些节点开始往下搜索,走过的路径称为“引用链(Reference Chain)”,当一个对象到“GC roots” 没有任何引用链,说明这个对象不可达,证明该对象是不可用的
对象不可达是否立即销毁回收
销毁一个对象至少需要经历两次标记过程:
如果对象在进行可达性分析之后发现没有与roots相连的引用链,则会进行第一次标记并且进行一次筛选,筛选条件是该对象是否有必要执行finalize()方法(finalize()只会调用一次,如果对象没有重写finalize,或者jvm已经调用过一次finalize,这两种情况都视为“没必要执行”)
如果对象有必要执行finalize(),会将该对象放置在一个F-Queue的队列之中,并在之后等待jvm自动建立一个低优先级的Finalizer线程去执行这个对象的finalize方法,如果在finalize()里面,将对象复制给静态函数的变量或其他对象的成员,建立起了引用链,这时就会被移出“即将回收” 的集合。
之后,GC会对F-Queue中的对象进行第二次标记,如果在这之前对象仍旧没和GC roots建立起引用链,基本已经确定会被回收了
垃圾回收算法
1. 标记-清除算法(mark-sweep)
算法分为两个阶段:“标记”和“清除”,标记出所有需要回收的对象,标记完成后统一回收。
标记过程可使用可达性分析和引用计数法来确定需要回收的对象
缺点:
1.效率问题,标记和清除效率都不高
2.空间问题,标记清除之后会产生大量的内存碎片,碎片太多会导致下次分配大对象时,无法找到连续的内存提前触发垃圾收集动作
2.复制算法
为了解决效率问题,复制算法将可用的内存分成大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将存活的对象复制到另一块内存上去,再把已经使用过的内存空间一次性清除掉,这样每次都是对一半的内存进行回收,再分配时不需要考虑内存碎片问题,只需要移动堆顶指针,按顺序分配
优点:
实现简单,高效,没有内存碎片,不会频繁因为碎片触发垃圾回收动作
缺点:
使用一半的内存空间作为代价,如果存活对象占比很高,效率会很低
新生区的对象存活期都很短,98%的对象“朝生夕死”,所以并不需要1:1划分区域,而是划分为80%的eden区和两个10%的survivor区,每次使用eden区和一块survivor区,当回收时将eden和survivor区还存活的对象一次性复制到另一块survivor区,最后清理掉使用过的eden和survivor区,当备用survivor内存不够时,需要依赖老年代,进行分配担保(Handle Promotion)
3.标记-整理算法(mark-Compact)
复制算法一般适用于存活时间短的区域,所以对于新生代很合适,对于老年代里面存活时间很长的对象,使用复制算法会显得效率很低,甚至出现极端情况,所有的对象都存活。
标记-整理算法的标记也分为两阶段:标记阶段和标记-清除算法一致,整理阶段是让所有存活的对象都向一侧移动,然后清理掉端边界以外的内存
4.分代收集算法
按照java存活周期将内存分为几部分,一般是划分为新生代和老年代,然后根据每个部分的对象特点选择合适的算法(上述几种)