1、JVM垃圾收集器发展过程
1、第一阶段:Serial(串行)收集器
特点:单线程收集器,垃圾回收时,必须暂停其他所有工作线程。
2、第二阶段:Parallel(并行)收集器
特点:充分利用多核特性,使用多线程完成清理工作。
3、第三阶段:CMS(并发)收集器
特点:垃圾收集线程和用户线程,可以同时执行。
缺点:CPU资源敏感;无法处理浮动垃圾;大量内存碎片
初始标记:【需要停顿】。只标记GC ROOTS能直接关联到的对象,速度很快
并发标记:与用户线程同时执行。标记GC ROOTS所有能关联到的对象。
重新标记:【需要停顿】。修正并发标记期间,因用户程序执行导致标记变动的记录。
并发清除:与用户线程同时执行,清理标记的垃圾对象。会产生浮动垃圾
4、第四阶段:G1(Garbage-First)(并发)收集器
特点:引入分区(分治、部分收集),弱化分代。关注最小时延,适合大尺寸堆内存。应用在多处理器和大容量内存环境中,尽量缩短处理超大堆(大于4GB)时,产生的停顿。带有整理功能,相对CMS内存碎片的产生率大大降低;STW可控,停顿时间上加了预测机制
2、G1收集器对比CMS
1、算法:
基于标记-整理算法,碎片产生率降低。CMS有可能出现分配大对象时,无法得到连续空间而导致提前触发一次full gc。
2、停顿时间可控:通过设置预期停顿时间,控制gc时间,避免应用雪崩。
3、收集区域:G1虽然保留了新老代的概念,但是收集器是以整个区域为单位收集的。G1可以在Young GC中使用,CMS只能在Old区(常搭配ParNew收集年轻代)。
4、Remark阶段高效:RSet解决跨代引用(如Old区域引用Young区域对象)、SATB算法记录漏标对象。
1.G1之前JVM内存模型
2.G1收集器的内存模型
Humongous:存放大对象(超过Region容量的一半)。
4、G1重点参数
-XX:+UseG1GC:启用G1收集器
-XX: G1HeapRegionSize:设置Region分区大小。1M~32M,size越大垃圾存活时间长,gc间隔长,但gc的持续时间边长
-XX: MaxGCPauseMillis:最大GC停顿时间,软目标。
3、G1收集器底层原理
1)G1运作过程
1.初始标记:标记GC Roots能直接关联到的对象。修改TAMS指针(Top at Mark Start),【G1为每个Region分配了两个指针,用于记录回收过程中新对象的分配】,短暂停顿用户线程,借用Minor GC时完成。
2.并发标记:从GC Roots开始递归扫描整个堆,对堆中对象进行可达性分析。【与用户线程并发执行,并发过程漏标对象使用SATB(snapshot-at-the-beginning)算法记录】
3.最终标记:短暂停顿用户线程,处理并发阶段遗留的漏标对象。
4.筛选回收:对各个Region的回收价值和成本进行排序,根据用户期望的停顿时间,制定回收计划,回收一部分Region。【两种回收模式,Young GC、Mixed GC】
2)Young GC回收过程
分配一般对象(非巨型对象)时,所有E区使用达最大阈值且无法申请到足够内存时,进行一次Young GC。回收所有S区和E区,将存活对象复制到O和另外S区。
1.根扫描(初始标记)。STW,扫描GC Roots对象
2.处理Dirty Card,更新Rset。
3.扫描Rset。扫描Rset中所有Old区对Young区、S区的引用。
4.对象拷贝。拷贝存活对象到S区和Old区。
3)Mixed GC回收过程
当越来越多对象晋升到O区时,为避免内存耗尽,虚拟机会触发mixed gc。回收整个E和S区,根据用户期望停顿时间,回收一部分O区。
4、G1底层支持
1)三色标记与漏标问题
三色标记
黑色:跟对象;或者该对象和他的子对象都被扫描过。
灰色:本身被扫描,但还未扫描该对象的子对象。
白色:未被扫描的对象;扫描完所有对象后,白色为不可达对象(垃圾对象)
漏标问题
CMS中的解决方案:Incremental Update算法:当一个白色的对象被一个黑色对象引用,【将黑色对象重新标记为灰色】,让垃圾回收器重新扫描。
G1中的解决方案:SATB(snapshot-at-the-beginning):当B->C的引用链消失时,将C推到GC的堆栈上,保证C还能被GC扫描到。
2)Rset解决跨代引用
现象:如果老年代引用了新生代的对象,那么回收新生代时,要跟踪老年代到新生代的所有引用。
Remembered Set:Hash表,Key是Region的地址,Value是对象的卡页集合。【其他Region中的对象引用本Region中对象的关系,表示谁引用了我的对象】
CardTable:如果一个O区CardTable中有对象指向Y区,就将它设置为Dirty,下次扫描时,只需要扫描CardTable上是Dirty的内存区域即可。
3)TAMS(Top at Mark Start)指针
G1为每个Region区域设计了两个TASM指针。要达到与用户线程并发运行,必须要解决回收过程中新对象的分配。从Region区域划分出一部分空间,用于记录并发回收过程中的新对象产生,不纳入垃圾回收范围。
4)安全点与安全区域
安全点:用户线程暂停,GC线程开始工作,要确保用户暂停的这行字节码指令,【不会导致引用关系的变化】,如【方法调用、循环跳转、异常跳转等】
主动式中断:设置一个标志,各用户线程主动轮训这个标志,True则在最近的安全点上主动中断挂起。
安全区域:如果业务线程处于Sleep或者Blocked状态,程序则没办法进入安全点。作为安全点的扩展【确保在某段代码中,引用关系不会发生变化】