声明:本文摘抄自《深入理解Java虚拟机》一书,本文完全为自我学习,请感兴趣的同学购买正版,支持原创
G1(Grabage-First)收集器是当今收集器技术发展的最前沿成果之一,它已在JDK 1.7 u4版本正式投入使用。G1是一款面向服务端应用的垃圾收集器,它定位于替换JDK1.5中发布的CMS收集器。
与其他收集器相比,G1收集器具有以下特点:
- 并行与并发:G1能充分利用多CPU,多核环境下的硬件资源,使用多个CPU(CPU或者CPU核心)来缩短Stop-The-World的停顿时间,部分其它收集器原本需要暂停Java执行线程来进行GC,G1收集器可以通过并发的方式让Java执行线程继续运行。
- 分代收集:与其它收集器一样,分代收集依然在G1中得到保留。虽然G1收集器可以不需要其它收集器配合就能够对整个Java堆进行管理,但它采用不同的方式去处理新创建的对象和已经存活了一段时间,且熬过多次GC的旧对象。
- 空间整合:与CMS的”标记-清除“算法不同,G1从整体来看是基于”标记-整理“算法的收集器,从局部上来看是基于”复制“算法实现的,但无论如何,这两种算法都意味着G1运行期间不会产生内存空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续的内存空间而提前触发Full GC。
- 可预测的停顿:这是G1相对CMS的另一大优势。降低停顿时间是G1和CMS共同的关注点,G1除了最求低停顿外,还能提供可预测的停顿时间模型,能让使用者明确指定一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒。
使用G1收集器时,Java堆内存布局与其他收集器(新生代和老年代)有很大区别。它将整个Java堆划分为大小相等的独立区域(Region),虽然还保留新生代和老年代的概念,但新生代和老年代不再是物理上隔离的了,它们都是一部分Region的集合。
G1之所以可以建立可预测的停顿时间模型,是因为它可以有计划的避免在Java堆中进行全区域的垃圾收集。G1跟踪各个Region中垃圾堆积的价值大小,在后台维护一个优先列表,每次根据允许收集的时间,优先回收价值最大的Region。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限时间内可以获取尽可能高的收集效率。
G1把内存”化整为零“的思路,理解起来似乎很容易,但其实现细节远远没有想象中那么简单。把Java堆分为多个Region后,垃圾收集器是否就真能以Region为单位进行垃圾回收?首先Region不可能是孤立的。一个对象被分配在某个Region中,它并非只能被这个Region中的其他对象引用,而是可以与Java堆中任意对象发生引用关系。那在做可达性分析判定对象是否存活的时候,岂不是还得扫描整个Java堆才能保证准确性。
在G1收集器中,Region中对象之间的引用和其他收集器中新生代和老年代中对象之间的引用,虚拟机都是使用Remembered Set来避免全堆扫描的。G1中每一个Region都有一个与之对应的Remembered Set,虚拟机在发现程序对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中,如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。当进行内存回收时,在GC根节点的枚举范围加入Remembered Set即可保证不对全堆扫描也不会有遗漏。
如果不计算维护Remembered Set的操作,G1收集器运作大致分为以下几个步骤:
- 初始化标记(Initial Marking)
- 并发标记(Concurrent Marking)
- 最终标记(Final Marking)
- 筛选回收(Live Data Counting and Evacuation)
初始标记阶段仅仅只是标记一下GC Roots能直接关联上的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发执行时,能在正确可用的Region中创建新对象,这阶段需要停顿线程,但耗时很短。
并发标记阶段是从GC Roots开始对堆中的对象进行可达性分析,找出存活的对象,这阶段耗时较长,但可与用户线程并发执行。
最终标记阶段是为了修正在并发标记阶段期间因用户线程继续运行而导致标记产生变动的那一部分标记记录,虚拟机将这段时间内对象变化记录在线程Remembered Set Logs里面,最终标记需要将Remembered Set Logs的数据合并到Remembered Set中,这阶段需要停顿用户线程,但可以并发执行。
最后是筛选回收阶段,在筛选回收阶段首先对各个Region的回收价值和成本进行排序,根据用户所希望的GC停顿时间来制定回收计划,从Oracle公司透漏的出来的信息来看,这个阶段也可以做到与用户线程一起并行执行,但是因为只回收一部分Region,时间是用户控制的,而且停顿用户线程将大幅提高收集效率。