1 并发和并行的垃圾收集器
-
并行
多条垃圾收集线程并行工作,但此时用户线程仍然处于等待状态。
-
并发
用户线程与垃圾收集线程同时执行(但不一定是并行的,可能会交替执行),用户程序在继续执行,而垃圾收集程序运行于另一个CPU上。
2 JVM的运行模式
3 新生代垃圾收集器
3.1 Serial收集器
Serial/Serial Old 收集器运行示意图
-
单线程
只会使用一个CPU或一条GC线程去完成垃圾收集工作。在它进行垃圾收集时,必须暂停其它所有的工作线程(Stop The World),直到它收集结束。
-
适合运行在Client模式下的虚拟机
在用户的桌面应用场景中,分配给虚拟机管理的内存不会很大,GC时间较短。
-
简单高效
没有线程切换的开销。
- 采用复制算法
3.2 ParNew收集器
ParNew/Serial Old 收集器运行示意图
-
多线程
ParNew收集器是Serial收集器的多线程版本。
-
许多运行在Server模式下的虚拟机中首选的新生代收集器
除了Serial收集器外,目前只有ParNew收集器能与CMS收集器配合工作。
3.3 Parallel Scavenge收集器
- 多线程
- 采用复制算法
-
追求吞吐量
这里的吞吐量是指CPU用于运行用户代码的时间与CPU总消耗时间的比值。CPU总消耗时间=CPU用于运行用户代码的时间+GC的时间。高吞吐量可以高效地利用CPU时间,尽快完成程序的运算任务,主要适合在后台运算而不需要太多交互的任务。
-
参数
-XX:MaxGCPauseMillis设置垃圾收集最大停顿时间。
-XX:GCTimeRatio设置GC的时间占CPU总消耗时间的比率。
-XX:+UseAdaptiveSizePolicy开启GC自适应的调节策略(和ParNew收集器的一个重要区别)。
4 老年代垃圾收集器
4.1 Serial Old收集器
Serial/Serial Old 收集器运行示意图
-
单线程+适合运行在Client模式下的虚拟机
Serial Old收集器是Serial收集器的老年代版本。
- 采用标记-整理算法
4.2 Parallel Old收集器
Parallel Scavenge/Parallel Old 收集器运行示意图
-
多线程+追求吞吐量
Parallel Old收集器是Parallel Scavenge收集器的老年代版本。
- 采用标记-整理算法
4.3 CMS收集器
-
追求最短回收停顿时间
目前集中在互联网站或者B/S系统的服务端上的Java应用尤其重视服务的响应速度,希望系统停顿时间最短,以给用户带来较好的体验。
- 采用标记-清除算法
-
运作过程
(1)初始标记:标记一下GC Roots能直接关联到的对象。
(2)并发标记:进行GC Roots Tracing的过程(判断哪些对象是存活的)。
(3)重新标记:修正并发标记期间因用户程序继续运作而导致标记产生变动的那一部分对象的标记记录。
(4)并发清理:清理未被标记的对象。
-
缺点
(1)CMS收集器对CPU资源非常敏感。其实,面向并发设计的程序都对CPU资源比较敏感。在并发阶段,它虽然不会导致用户线程停顿,但是会因为占用了一部分线程(或者说CPU资源)而导致应用程序变慢,总吞吐量会降低。
(2)CMS收集器无法处理浮动垃圾,可能出现“Concurrent Mode Failure”失败而导致另一次Full GC产生。由于CMS并发清理阶段用户线程还在运行着,伴随程序运行自然就会有新的垃圾不断产生,这一部分垃圾出现在标记过程之后,CMS无法在当次收集中处理掉它们,只好留待下一次GC时再清理。这一部分垃圾称为“浮动垃圾”。由于在垃圾收集阶段用户线程还需要运行,那也就还需要预留有足够的内存空间给用户线程使用,因此CMS收集器不能像其它收集器那样等到老年代几乎完全被填满再进行收集,需要预留一部分空间提供并发收集时的程序运作使用。如果CMS收集器运行期间预留的内存无法满足程序需要,就会出现一次“Concurrent Mode Failure”失败。
(3)CMS收集器采用标记-清除算法,GC结束时会有大量空间碎片产生。
5 G1收集器
-
特点
(1)并行与并发:能充分利用多CPU、多核环境下的硬件优势,使用多个CPU来缩短“Stop-The-World”停顿的时间。
(2)分代收集:与其它收集器一样,分代概念在G1中依然得以保留。
(3)空间整合:从整体来看是基于“标记-整理”算法实现的收集器,从局部(两个Region之间)上来看是基于“复制”算法实现的。这意味着G1运作期间不会产生内存空间碎片,收集后能提供规整的可用内存。
(4)可预测的停顿:这是G1相对于CMS的另一大优势,降低停顿时间是G1和CMS共同的关注点,但G1除了追求低停顿外,还能建立可预测的停顿时间模型,能让使用者明确指定在一个长度为M毫秒的时间片段内,消耗在垃圾收集上的时间不得超过N毫秒,这几乎已经是实时Java(RTSJ)的垃圾收集器的特征了。
在G1之前的其它收集器进行收集的范围都是整个新生代或者老生代,而G1不再是这样。使用G1收集器时,Java堆的内存布局与其它收集器有很大差别,它将整个Java堆划分为多个大小相等的独立区域(Region),虽然还保留有新生代和老年代的概念,但新生代和老年代不再是物理隔离的了,它们都是一部分Region(不需要连续)的集合。
G1收集器之所以能建立可预测的停顿时间模型,是因为它可以有计划地避免在整个Java堆中进行全区域的垃圾收集。G1跟踪各个Region里面的垃圾堆积的价值大小(回收所获得的空间大小以及回收所需时间的经验值),在后台维护一个优先列表 ,每次根据允许的收集时间,优先回收价值最大的Region(这也就是Garbage-First名称的由来)。这种使用Region划分内存空间以及有优先级的区域回收方式,保证了G1收集器在有限的时间内可以获取尽可能高的收集效率。
在G1收集器中,Region之间的对象引用以及其他收集器中的新生代与老年代之间的对象引用,虚拟机都是使用Remembered Set来避免全堆扫描的。G1中每个Region都有一个与之对应的Remembered Set,虚拟机发现程序在对Reference类型的数据进行写操作时,会产生一个Write Barrier暂时中断写操作,检查Reference引用的对象是否处于不同的Region之中(在分代的例子中就是检查是否老年代中的对象引用了新生代中的对象),如果是,便通过CardTable把相关引用信息记录到被引用对象所属的Region的Remembered Set之中。当进行内存回收时,在GC根结点的枚举范围中加入Remembered Set即可保证不对全堆扫描也不会有遗漏。
-
过程
(1)初始标记:标记一下GC Roots能直接关联到的对象,并且修改TAMS(Next Top at Mark Start)的值,让下一阶段用户程序并发运行时,能在正确可用的Region中创建新对象。
(2)并发标记:从GC Roots开始对堆中对象进行可达性分析,找到存活的对象。
(3)最终标记:修正在并发标记期间因用户程序继续运作而导致标记产生变动的那一部分标记记录。
(4)筛选回收:对各个Region的回收价值和成本进行排序,根据用户所期望的GC停顿时间来制定回收计划。