JVM 之垃圾收集器

如转载,请标明出处

什么对象应被回收

一般地,一个对象没有被引用,说明这个对象“已死”,可以被回收。那么如何标记这个对象是否被引用?一般包含如下两种算法:

  • 引用计数算法
    对象被引用一次,就将引用计数器加1;相反,就减1。这种算法简单且效率高,但是无法解决循环引用的问题。
  • 可达性分析算法
    Java中采用的是这种算法。从一系列被称为“GC Roots”的对象为起点开始寻找,当一个对象到GC Roots无任何引用链时,这个对象就可视为不可达的,因此可以回收。
    GC Roots主要存在全局性的引用和执行上下文中:
  • 线程栈引用的对象
  • 本地方法栈引用的对象
  • 类静态属性引用的对象
  • 常量引用的对象

垃圾回收算法

算法名称 特点 说明
标记-清除(Mark-Sweep) 效率不高;产生内存碎片 一般老年代使用
复制算法 没有内存碎片;但得预留一部分内存;需要依赖其他内存(分配担保) 一般新生代使用;
标记-整理(Mark-Compact) 一般老年代使用
分代收集算法 -

HotSpot算法

Stop-The-World

Java是通过GC Roots来寻找标记不可达的对象,因此,在这个过程中,用户的线程是不能运行的,否则标记的不可达对象是不精确的,这种停顿所有用户线程而且必须停顿的过程形象得称为"Stop-The-World",简称"GC停顿"。好的垃圾收集器的指标之一就是缩小GC停顿的时间。
为了加快定位程序中哪些地方存在对象引用,HotSpot定义了一个称为OopMap(Ordinary Object Pointer)的结构来预先存储这些位置,这样垃圾收集器就能更快得标记出不可达对象。

Safepoint & Saferegion

一般情况下,程序中存在引用的地方是很多的,如果每个地方都存入OopMap,GC的成本也会很高。因此只在某些特定的位置生成OopMap,这些位置称为Safepoint
在Safepoint,对象的引用链该改变的已经改变,暂时不会再发生变化,比如方法调用,循环跳转等;当一个线程运行到了一个方法内,那么此时不应该让这个用户线程停顿(因为方法执行后,引用可能发生变化,之前不可达,方法执行后又可达了),此时就可以把方法结束的点称为Safepoint。
在主动式中断中,当发生GC时,不是直接停顿用户线程,而是设置一个标记,当用户线程运行到Safepoint时,就主动去查看这个标记,若发现了停顿标记,就挂起自己;否则继续运行。不同的垃圾回收器定义的Safepoint可能不同。

Safepoint完美得解决了运行中的线程停顿问题,但是不运行的线程,比如sleep的线程就无法响应JVM的中断请求。因此就提出了Saferegion
Saferegion中的代码可能无法响应JVM中断请求,但是引用关系也不会改变,所以,这区域的代码并不会影响GC Roots枚举的结果。JVM 发起GC时就可以忽略这些进入到Saferegion的线程了。
当一个线程离开Saferegion时,要检查是否完成了GC Roots枚举或GC过程,若没有完,则不能离开直到上述过程结束。

垃圾回收器

新生代收集器有以下三种,都使用复制算法

  • Serial 回收器
    如其名,单线程的;是Client模式下的默认新生代回收器;
    GC log标识:def new generation

  • ParNew 回收器
    Serial回收器的多线程版本,一般也是在新生代中使用,使用该回收器还有一个很重要的原因是只有它和Serial回收器可以与CMS搭配使用;
    GC log标识:par new generation
    涉及到的参数:

    参数 作用
    -XX:+UseParNewGC 显示指定JVM新生代使用该回收器
    -XX:+UseConcMarkSweepGC 指定老年代使用CMS回收器,此时默认的新生代回收器为ParNew
    -XX:ParallelGCThreads 限制垃圾收集线程数
  • Parallel Scavenge 回收器
    大部分回收器都是以缩短用户线程停顿时间为设计目标,该款的关注点略有不同:达到一个可控的吞吐量【运行用户代码时间/(用户代码时间+垃圾收集收集时间)】;自适应调节策略是其与ParNew的一个重要区别
    GC log标识:PSYoungGen
    涉及到参数:

    参数 作用
    -XX:MaxGCPauseMillis 大于0的毫秒数,收集器尽可能保证GC时间不超过该值
    -XX:GCTimeRatio 0<value<100,默认值99,表示允许最大1%(1/(1+99))的GC时间
    -XX:+UseAdaptiveSizePolicy 默认打开,打开后,不需要手动设置新生代的大小、Eden比例、晋升老年代对象大小(-XX:PretenureSizeThreshold)等细节参数了,虚拟机会根据实际情况自动调节

老年代收集器包含以下几种,采用 标记-清除 or 标记-整理 算法

  • Serial Old 回收器
    基于标记-整理算法,Serial的老年代版本,同样是单线程的。与Parallel Scavenge搭配使用;也可在CMS Concurrent Mode Failure失败时使用。

  • Parallel Old 回收器
    基于标记-整理算法,Parallel Scavenge的老年代版本。
    GC log标识:ParOldGen
    相关参数:

    参数 作用
    -XX:+UseParallelGC 年轻代收集器设为Parallel Scavenge,老年代设为Parallel Old
  • CMS 回收器
    基于标记-清除算法,目标是获取最短停顿时间。整个过程大致分四个步骤:

    1. 初始标记
      只标记GC Roots能关联的对象,需要Stop-The-World
    2. 并发标记
      寻找不可达对象,在此期间,用户线程也在运行
    3. 重新标记
      修正因用户线程运行导致的引用发生变化的对象,需要Stop-The-World
    4. 并发清除
      用户线程也在运行

    缺点如下:
    > cpu资源敏感
    这一点好像无法避免

    > 无法处理浮动垃圾
    因为CMS gc时,用户线程也在运行,在此期间也会产生新的垃圾(浮动垃圾),这部分只能在下次GC时清理。
    除了这些浮动垃圾,用户线程运行过程也需要内存空间,因此需要预留一部分内存空间(别的收集器都是STW的,因此不必预留),如果预留的内存不足,则会出现Concurrent Mode Failure,启动备选方案,使用Serial Old进行一次Full gc(会STW)。CMS gc发生的条件是判断当前老年代的使用率,如果超过某个值,则会发生CMS gc;
    > 产生内存碎片
    CMS基于标记-清除算法,因此会产生碎片。这样会导致往往老年代有很多内存空间,但是无法分配大的对象导致Full gc。
    GC log标识:concurrent mark-sweep generation
    相关参数:

    参数 作用
    -XX:CMSInitiatingOccupancyFraction 发生CMS gc的阈值
    -XX:+UseCMSCompactAtFullCollection 默认开启,表示无法为对象找到足够空间而进行Full gc时,进行内存的整理,消除内存碎片
    -XX:CMSFullGCsBeforeCompaction 表示进行多少次不compact的Full gc后,进行一次compact Full gc;默认值为0,表示每次Full gc都进行碎片整理
  • G1
    G1目前使用较少,先不介绍。

最后盗一张图说明这些收集器的使用搭配:


collectors.png

上述内容都是个人理解,若有错误,请批评指正

本文参考了周志明《深入理解Java虚拟机》第2版

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容