标记-清除算法
标记-清除算法(Mark-Sweep)是最基础的垃圾收集算法,就如其名字,回收过程分为两个阶段,标记和清除。首先要标记出需要回收的对象,标记完成后,统一回收掉被标记的对象。
标记-清除算法有两点不足:
- 效率问题,标记和清除两个阶段的效率都不高
- 空间问题,标记清楚后会产生大量的不连续的内存空间,空间碎片过多,当程序运行过程中,需要分配大对象时,明明内存还有很充裕的空间,但是由于没有连续的内存空间可以分配而不得不提前触发一次GC
标记-清除算法如下图所示
复制算法
- 上面提到的标记-清除算法存在效率问题,为了解决效率问题,一种称为复制(Copying)算法的收集算法出现了。
- 主要思路是: 将内存划分为大小相等的两块,每次只使用其中的一块,当这一块的内存用完了,就将还存活的对象一次性全部复制到另外一块上,然后把标记为可清除的对象一次性清除掉。这样每次只会对整个半区进行回收,就不用担心空间碎片的问题了。每次只要移动堆顶指针,按顺序分配内存即可,实现简单,运行高效,唯一的问题就是每次都浪费一般的内存空间,这个代价不用多想,真心太高了。
复制算法如下图
复制算法的应用
- 其实虽然复制算法每次都浪费一般的存储空间,但是可以通过调整两个区域的大小比例来减小空间的浪费。在我们Java应用程序中,新生代中98%的对象是朝生夕死的。所以并不需要按照1:1的比例去划分两块区域。而是将内存划分为一块较大的Eden空间和两块较小的Survivor空间。每次使用一块Eden和Survivor。当回收时,将Eden和Surivivor中还存活的对象一次性复制到另一块Survivor空间中,然后对刚刚使用的Eden和Surivivor中被标记可回收的对象。我们常用的HotSpot虚拟机默认Eden和Surivivor的大小比例为8:1。这样,每次使用的内存空间为80%+10%=90%。只有10%的空间会被浪费掉。
- 如果在极端的情况下,在一次GC后,新生代中的对象100%都存活了,那么Surivivor肯定无法容纳那么大的存活对象,这时候就需要将对象移至老年代,即:需要老年代进行分配担保
标记-整理算法
- 复制算法在对象存活率较高时,就需要进行大量的对象复制操作,复制大量的对象到老年代,效率将会变低。而且,由于不想浪费50%的内存空间,就需要额外的空间进行分配担保,以应对GC后任然有100%的对象存活的极端情况。所以复制算法一般用于新生代,老年代一般不会直接选用这种垃圾收集算法。
- 根据老年代的特点,有人提出了 标记-整理算法(Mark-Compact).标记过程与标记清理算法中的标记一样,但是后续不是直接对可回收对象进行清理,而是将所有存活的对象向一端移动,然后直接清理掉端边界以外的内存,
标记-整理算法过程如下图
分代收集算法
- 当前虚拟机的垃圾收集都采用了“分代收集”(Generational Collection)算法,其实就是将内存划分为几块,如Java中的新生代和老年代,这样可以根据每个区域的特点采用适合该区域的垃圾收集算法。
- 新生代中,由于大部分对象都是朝生夕死,只有少量的对象存活,所以采用复制算法比较合适。只需要付出少量存活对象的复制成本,就可以完成收集工作。
- 老年代中由于对象的存活率高,而且不需要分配担保,所以比较适合采用标记-整理算法或者标记清理算法
参考:
周志明《深入理解Java虚拟机》
写在最后
做一个灵魂和肉体分离的人,灵魂不受肉体的束缚,灵魂可以指挥肉体