复制垃圾回收算法(Copying GC),是1963年由Marvin L. Minsky 研究得出的垃圾回收算法,简单的说它是通过将内存分为两个空间,在垃圾回收是将空间1的活动对象,直接复制到空间2中,然后全部回收掉空间1的对象。这里的空间1和空间2,分别被称为来源空间和目标空间。
碰撞分配
碰撞分配算法是在复制GC中,通过碰撞或者递增指针来跟踪下次分配发生的地方,以便从大块连续的内存堆中分配相邻的内存段。下图就是复制GC持有的分配指针,在每次内存分配的时候,它从内存堆中返回一段内存地址,然后再将分配指针向后移动,这样地址空间时连续的,但是因为分配的对象大小的不同,所以分配的比例并不是平均的。
这种方式的优点是,简单易行,运行速度快,并且因为每次分配的内存段都是相邻的,所以具有很好的局部引用性,意思就是应用程序如果重复访问同一片内存段,那么CPU可以将那片内存段缓存起来,用以提供程序访问的速度。
半空间算法
碰撞分配讲到了复制GC如何分配,半空间算法才是真正的垃圾回收,半空间算法是在,初始内存堆消耗殆尽时,通过GC标识存活对象和垃圾对象(这个阶段和标记清除算法是一样的)也就是标记阶段,在回收阶段,GC将通过碰撞分配的来源空间(From-Space)中的存活的对象,全部移动到目标空间(To-Space)中。
上图中"M"的区域就是存活的对象,空白区域是垃圾对象底部空间就是目标空间(To-Space)在回收阶段复制GC将存活对象连续的复制到目标空间(进行保持局部引用性)分配指针向后移动。
我们从上图看到存活对象已经被全部复制到目标空间,但是我们的内存分配只能在来源空间进行,并且现在来源空间的内存还没有被回收掉,那么复制GC的最后一个阶段就是空间交换,然后在交换完成是清空目标空间。
半空间算法的简单快速的优点,同时带来了另外一个问题,就是内存使用的低效,我们需要维护两个空间相同的内存堆来,并且仅仅有一个内存对是当前能够正在被使用的,意味着要分配实际使用内存的两倍。
总结
我们来回顾一下复制垃圾回收算法的优缺点
优点
- 高吞度量:因为仅仅需要在标记阶段消耗实际,复制阶段无需太多时间,所以GC的时间消耗和空间中的活动对象数量成正比,相比于标记清除GC有较高的吞吐量。
- 高速分配:与标记清除算法使用空闲列表进行内存分配不同,复制GC使用连续的内存空间,这样就省去的使用空闲列表,分配内存时,线性查找可分配空间的时间消耗。
- 局部引用缓存和空间压缩:因为复制GC的分配是连续的,所以在可以利用局部引用缓存,并且每次GC后内存空间都会被集中到空间的一段,也就实现了空间压缩。
缺点
- 空间效率低 复制GC需使用两个堆空间,也就是实际空间的两倍,这样的内存消耗耗是比较客观的。
- 递归复制 因要整体的复制存活对象到目标空间去,所以复制GC使用了递归方式,复制存活对象的子对象。如果递归层次太深还可能产生溢出。