垃圾收集算法与收集器

一. 概述

如果说垃圾收集算法是内存回收的方法论,垃圾收集器就是内存回收的具体实现. 垃圾收集器的选择,并非是找出最好的,而是最适合的. 直到现在为止还没有最好的垃圾收集器出现,更加没有万能的垃圾收集器.

二. 垃圾收集算法

image.png

当前绝大多数(几乎所有)垃圾收集器垃圾回收算法都是基于分代收集理论实现的. 根据对象生存周期不同,采用不同回收算法.

三. 垃圾收集器

image.png

3.1 Serial 串行垃圾收集器

算法

  • 年轻代: 复制算法
  • 老年代: 标记整理

串行

  • 单线程
  • gc阶段STW(Stop The World)

优点

  • 简单:单线程收集,实现简单
  • 高效:相同cpu资源,收集最高效

缺点

  • 全程STW
  • 单线程: 多核处理器下无法充分利用服务器资源

核心参数

-XX:+UseSerialGC -XX:+UseSerialOldGC

3.2 Parallel 并行垃圾收集器

Serial的多线程版本. 通过提高单位时间内的垃圾收集吞吐量,来降低STW时间.

算法

  • 年轻代: 复制算法
  • 老年代: 标记整理

并行

  • 多线程

优点

  • 简单:相对简单
  • 高效:多核处理器环境下,支持多线程,充分利用服务器资源提高. 通过提高单位时间吞吐量,减少STW

缺点

  • 全程STW

** 开启**

-XX:+UseParallelGC
-XX:+UseParallelOldGC
-XX:ParallelGCThreads: 指定收集线程数,默认的收集线程数跟cpu核数相同

3.3 ParNew

基本同Parallel .不同点在于它支持和CMS搭配使用.
-XX:+UseParNewGC

3.4 CMS 并发垃圾收集器

一款真正的并发垃圾收集器. 以获取最短STW为目标的收集器. 和上述收集器最大的不同是:将垃圾收集分为多个阶段,且在部分阶段支持gc线程和用户线程并行.

3.4.1 收集步骤(无营养版)

  1. 初始标记: STW. 记录GCRoots直接引用的对象. 很快.
  2. 并发标记: gc线程和用户线程同时运行. 从GC Roots的直接关联对象开始遍历整个对象图的过程.这个过程很耗时,但是并不STW.
  3. 重新标记(最终标记): STW. 耗时比初始标记大,但远比并发标记阶段耗时小.利用三色标记 通过增量更新算法修正并发标记期间因为用户程序继续运行而导致标记产生变动的那一部分对象的标记记录
  4. 并发清理: gc线程和用户线程同时运行. 清理垃圾. 这个阶段新生成的对象直接标记为(黑色)非垃圾.
  5. 并发重置: 清除标记

3.4.2 三色标记

利用三个颜色表示是否已完全扫描,是否可达

  • 黑色 可达且直接引用已完全扫描. --- 不会再扫描了
  • 灰色 可达但存在直接引用未扫描. --- 以它为root 接着扫描
  • 白色 表示不可达或者未扫描.

3.4.3 收集步骤(营养版)

image.png

初始标记: gc root 全部为黑色. gc root 直接引用的对象可能为灰色或者黑色.

并发标记: 这个阶段,多线程标记,存在以下标记状态:


image.png

这个阶段gc线程和用户线程并发执行. 可能存在以下情况:

  • set O3.o5=null ; O1.o5=O5;
  • 局部变量R2随着线程执行结束而销毁
  • 新的线程创建新的对象. R3.o7=new O7();
    image.png

    如果不此时直接根据标记结果回收对象,会存在多标漏标
    -多标 局部标量R2引用的对象O6已经是垃圾,但是被标记为黑色. 这些垃圾称为浮动垃圾,可以接受,下次gc回收. O7页可能是浮动垃圾.
    -漏标 O3断开了和O5的引用关系,而O1已经是黑色,表示已经扫描完成. O5非垃圾对象,但是标记完成还是白色不可达. 这种情况是不可接受的,可能造成系统Bug. 下个阶段重点解决漏标问题.

重新标记

  • 浮动垃圾 本轮不处理
  • 漏标 漏标可能造成系统Bug,必须要解决的. 我们首先分析一下漏标是如何发生的.
    漏标的充分必要条件
  1. 赋值器插入了一条或多条从黑色对象到白色对象的新引用
  2. 赋值器删除了全部从灰色对象到该白色对象的直接或间接引用
    如何理解?或者说为什么?
  • 在并发标记阶段,新生成的对象都是黑色. 所以漏标只需考虑老的对象.
  • 条件1好理解: 白色对象只有被移动到了已经被标记为黑色的对象下才可能逃离被标记.
  • 条件2包含两个意思:
    a. 必须是全部灰色对象到改对象的引用. 如果仍存在只需一个到灰色对象的引用,随着扫描的进行,改白色对象必然会被扫描到.
    b.条件1中白色对象之前必须被灰色对象直接或者间接引用; 为什么必须满足呢? 这一疑问可以转化为 条件1的白色对象在赋值前是否可能不在任何灰色对象的引用链下,即不在任何rc root的引用链下,即垃圾. 答案是否定的. 如果是垃圾对象,疑问着程序运行阶段无法直接获取到对象的引用.
    漏标的解决
    我们已经知道漏标的充分必要条件.那么只要我们破坏其一即可避免漏标的发生.
  • 增量更新: 破坏的是第一个条件,当黑色对象插入新的指向白色对象的引用关系时,就将这个新插入的引用记录下来,等并发扫描结束之后,再将这些记录过的引用关系中的黑色对象为根,重新扫描一次。这可以简化理解为:黑色对象一旦新插入了指向白色对象的引用之后,它就变回灰色对象了,CMS使用的是这种解决方案
    -原始快照(STAB): 破坏的是第二个条件.当灰色对象要删除指向白色对象的引用关系时,就将这个要删除的引用记录下来,在并发扫描结束之后,再将这些记录过的引用关系中的灰色对象为根,重新扫描一次。这也可以简化理解为:无论引用关系删除与否,都会按照刚刚开始扫描那一刻的对象图快照来进行搜索,G1使用的是这种解决方案. 这种方案可能产生浮动垃圾.
    如何实现:
    -写屏障 在赋值操作前后,加入一些处理.类似AOP
    -读屏障 在读取一个对象,在赋值前就记录下引用关系
    CMS:增量更新 VS G1:STAB
  • 猜测其他的想法是很难(stupid)的
  • 增量更新因为需要重新深度扫描变更的关系,所以效率上比较低.
  • STAB可能引入更多的浮动垃圾
  • G1本身目标就非收集所有垃圾,而是可预测的时间内收集部分垃圾. 浮动垃圾不是问题. 从内存体量上讲, G1通常用于大内存. 深度扫描的成本比CMS更高.

并发清理
gc线程和用户线程并发. 这个时候所有新生成的对象及其引用都被标记为黑色. 引入更多浮动垃圾

3.4.4 CMS垃圾收集器缺点和问题

  • 实现复杂
  • 对CPU资源敏感(会和服务抢资源)
  • 它使用的回收算法-“标记-清除”算法会导致收集结束时会有大量空间碎片产生,当然通过参数- XX:+UseCMSCompactAtFullCollection可以让jvm在执行完标记清除后再做整理
  • 执行过程中的不确定性,会存在上一次垃圾回收还没执行完,然后垃圾回收又被触发的情况,特别是在并发标记和并发清理阶段会出现,一边回收,系统一边运行,也许没回收完就再次触发full gc,也就是"concurrent mode failure",此时会进入stop the world,用serial old垃圾收集器来回收

3.4.5 核心调优参数

  1. -XX:+UseConcMarkSweepGC:启用cms
  2. -XX:ConcGCThreads:并发的GC线程数
  3. -XX:+UseCMSCompactAtFullCollection:FullGC之后做压缩整理(减少碎片)
  4. -XX:CMSFullGCsBeforeCompaction:多少次FullGC之后压缩一次,默认是0,代表每次FullGC后都会压缩一 次
  5. -XX:CMSInitiatingOccupancyFraction: 当老年代使用达到该比例时会触发FullGC(默认是92,这是百分比)
  6. -XX:+UseCMSInitiatingOccupancyOnly:只使用设定的回收阈值(-XX:CMSInitiatingOccupancyFraction设 定的值),如果不指定,JVM仅在第一次使用设定值,后续则会自动调整
  7. -XX:+CMSScavengeBeforeRemark:在CMS GC前启动一次minor gc,目的在于减少老年代对年轻代的引用,降低CMS GC的标记阶段时的开销,一般CMS的GC耗时 80%都在标记阶段
  8. -XX:+CMSParallellnitialMarkEnabled:表示在初始标记的时候多线程执行,缩短STW
  9. -XX:+CMSParallelRemarkEnabled:在重新标记的时候多线程执行,缩短STW;

3.5 G1收集器

G1 (Garbage-First)是一款面向服务器的垃圾收集器,主要针对配备多颗处理器及大容量内存的机器. 以极高概率满足GC 停顿时间要求的同时,还具备高吞吐量性能特征.

image.png

G1 目前接触较少,本章节暂不讨论.以后单独章节补充

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,701评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,649评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,037评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,994评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,018评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,796评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,481评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,370评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,868评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,014评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,153评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,832评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,494评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,039评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,156评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,437评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,131评论 2 356