谈到JVM的垃圾回收(GC),可能这才是你想了解的!

谈到JVM的垃圾回收(GC),可能这才是你想了解的!

image

垃圾收集 (Garbage Collection) 机制是Java语言的一大优势特性, 为充分榨取JVM性能, 避免系统因垃圾收集不及时导致的OOM (OutOfMemory, 内存溢出)问题, 或内存饱和出现无法响应用户请求的情况, 就需要根据服务器配置及应用复杂度对GC策略进行优化, 以确保系统正常运行.

1 JVM中Java对象的分类

JVM根据运行于其中的对象的生存时间, 将它们分为3种, 并分别存放在JVM的不同内存区域中. 这种对象存放空间的管理方式叫做Generation管理方式.

(1) Young Generation (新生代, 又称年轻代): 用于存放"早逝"对象(即瞬时对象), 一般的Java应用中, 80%的对象都是"朝生息灭"的, 比如在创建对象或调用方法时使用的临时对象或局部变量.

(2) Tenured Generation (老年代): 用于存放"驻留"对象(即被引用较长时间的对象). 往往体现为一个大型程序中的全局对象或长时间被使用的对象.

(3) Perm Generation (永久代): 用于存放"永久"对象. 这些对象管理着运行于JVM中的类和方法.

2 JVM的GC类型及触发条件

2.1 Young GC

又叫Minor GC(次收集), Young GC经常发生, 且其每次消耗的时间较短.

—— 它只对Young Generation中的对象进行垃圾收集.

触发条件:

在Young Generation(新生代)的Eden区的空间不足以容纳新生成的对象时执行, 同时会将 Eden 区与 From Survivor 区中尚且存活的对象移动至空闲的 To Survivor 区中.

—— 程序运行过程中, 始终有一个 Survivor 区是完全处于空闲状态的, 如果不是, 说明应用程序出现故障了.

2.2 Full GC

又叫Major GC(主收集), 是对整个Java Heap中的对象(不包括永久代/元空间)进行垃圾收集.

Full GC操作耗时久, 对系统的性能影响较大, 因此在 JVM 的调优中, 很多工作是针对 Full GC 的调优 —— 要尽可能减少Full GC的频率.

Full GC 是一种"昂贵"的垃圾收集方式, 它要对整个Heap进行垃圾收集, 并做一定的空间整理, 这会使Stop-The-World的时间变长.

Full GC的触发条件:

(1) 年老代(Tenured)空间不足: 通过Minor GC后进入老年代的对象的体积大于老年代的可用空间;由Eden块、From Space块向To Space复制存活对象时, 它们的体积大于To Space的大小, 系统就会把这些对象转存到老年代, 而老年代的可用空间小于这些对象的体积. (2) System.gc()方法被显式调用, 系统建议执行Full GC, 但并不会立即执行 —— 非常影响程序性能, 建议禁止使用; (3) 上一次GC之后Heap中各个区域空间的动态变化.

3 Java对象生成时的内存申请过程

(1) JVM会试图为相关Java对象在年轻代的Eden区中初始化一块内存区域;

(2) 当Eden区空间足够时, 内存申请结束. 否则执行下一步;

(3) JVM 试图释放在Eden区中所有不活跃的对象(即 出发Young GC), 释放后若Eden空间仍然不足以放入新对象时, JVM会试图将部分Eden区中活跃的对象迁移至Survivor区;

(4) Survivor区被用来作为Eden区及老年代的中间交换区域, 当老年代空间足够时, Survivor区中存活了一定次数的对象会被迁移到老年代;

(5) 当年老代空间不够时, JVM会在老年代进行完全的垃圾回收(Full GC);

(6) Full GC后, 若Survivor区及老年代仍然无法存放从Eden区复制过来的对象, 则会导致JVM无法在 Eden区为新生成的对象申请内存, 即出现 "Out of Memory".

OOM(Out of Memory)异常一般主要有如下2种原因:

(1) 老年代溢出, 表现为: java.lang.OutOfMemoryError:Javaheapspace, 这是最常见的情况, 产生的原因可能是: 设置的内存参数-Xmx过小或程序的内存泄露及使用不当问题. (2) 持久代溢出,表现为: java.lang.OutOfMemoryError:PermGenspace, 通常由于持久代设置过小, 动态加载了大量 Java 类而导致溢出, 解决办法唯有将参数 -XX:MaxPermSize 调大(一般256MB能满足绝大多数应用程序需求).

3 Oracle JDK中的垃圾收集器

3.1 串行收集器(Serial Collector)

只有一条GC线程, 运行时需要暂停用户程序(Stop-The-World).

实现: Serial(用于新生代, 采用复制算法)、serial old(用于老年代, 采用标记-整理算法).

3.2 并行收集器(Parallel Collector)

有多条GC线程, 运行时也需要暂停用户程序(Stop-The-World).

实现: ParNew(用于新生代, 采用复制算法)、Parallel Scavenge(用于新生代, 采用复制算法)、Parallel Old(用于老年代, 采用标记-整理算法).

3.3 并发收集器(Concurrent Collector)

有一条或多条GC线程, 且需要在部分阶段暂停用户程序(Stop-The-World), 部分阶段与用户程序并发执行.

实现: Concurrent Mark Sweep(CMS, 用于老年代, 采用标记-清除算法).

并发(concurrent)与并行(parallel)的比较:

(1) 并发就是两个任务(A和B)需要独立运行, 在任务A结束之前, 任务B开始执行 —— 即表面上多个任务同时执行. (2) 并行, 类比串行, 是微观概念, 即在每一个时刻都有多个任务在同时执行, 形象点理解为多管齐下, 串行可理解为单列队列, 同一时刻只能执行一个任务. (3) 事实上, 并行是并发的一种实现方式, 还有一种并发的实现方式, 即我们熟悉的时间片切换 —— 任务A执行一段时间, CPU再切换到任务B执行一段时间, 如此交替执行. 时间片切换在微观上仍然是串行 —— 某一具体时刻只有一个任务在执行, 而在宏观上, 即一段时间内, 有多个任务得到了执行. (4) 总结: 并行必须在多核多处理器或分布式系统(本质还是多核多处理器)中才能发生, 而单核处理器上只能发生时间片切换.

3.4 G1收集器(Garbage First GC)

G1垃圾回收器在 Oracle JDK 7 开始提供完整支持, 它是 server 型的 GC, 主要针对多核处理器和大内存的服务器, 能够以很高的概率 满足开发人员对停顿时间的要求, 同时还能保证高吞吐量.

(1) 与CMS收集器相比, G1收集器的优势:

① 基于标记-整理算法, 不会产生大量的内存碎片; ② 可以更加精确地控制停顿时间, 在不牺牲吞吐量前提下, 实现低停顿垃圾回收.

(2) G1收集器的实现原理:

G1收集器能够避免全区域的垃圾收集, 它把堆内存划分为大小固定的几个独立区域, 并跟踪这些区域的垃圾收集进度, 同时在后台维护一个优先级列表, 每次根据所允许的收集时间, 优先回收垃圾最多的区域. —— **区域划分和优先级区域回收机制, 确保G1收集器可以在有限的时间内获得最高的垃圾收集效率. **

G1的长期目标是取代CMS (Concurrent Mark-Sweep Collector) 并发标记-清除收集器.

3.5 其他概念说明

(1) 为了更大程度地榨取机器性能, 新生代的收集器都使用了复制算法, 老年代的收集器都使用 标记-清除 或 标记-整理 算法. 关于各算法详情, 请参阅: JVM内存管理———垃圾搜集器参数精解.

(2) 在实际应用中, 需要对JVM的新生代、老年代分别选择合适的垃圾收集器.

(3) 这里新生代和老年代都分别有三种实现, 但由于收集器的实现方式不同, 部分组合无法一起配合工作, 经过验证, 这六种垃圾收集器只有六种可用组合.

4 GC的配置参数

4.1 参数名称的说明

4.1.1 标准参数(-)

所有 JVM 都必须支持这些参数的功能, 而且向后兼容, 如:

-client : 设置 JVM 使用 client 模式, 特点是启动速度比较快, 但运行时性能和内存管理效率不高. 通常用于客户端应用程序或开发调试; 在32位环境下直接运行 Java 程序默认启用该模式. -server : 设置 JVM 诗 server 模式, 特点是启动速度比较慢, 但运行时性能和内存管理效率很高, 适用于生产环境; 在具有64位能力的JDK环境下默认启用该模式.

4.1.2 非标准参数(-X)

各 JVM 厂商应该全部实现这些参数的功能, 但并不能保证这些厂商提供的 JVM 中都实现了这些功能, 且不保证向后兼容;

4.1.3 非稳定参数(-XX)

此类参数在各个 JVM 的实现中会有所不同, 将来也可能不被支持, 要慎重使用.

注意: 在"-XX:"后的参数若不需要赋值, 即只是用来配置开启或关闭相应选项, 则需要有 **"+" (开启) 或 "-" (禁止) **, 否则应用程序将在日志文件 (如 Tomcat 的日志文件 catalina.out ) 中抛出如下错误:


Missing +/- setting for VM option 'UseConcMarkSweepGC'. 
Error: Could not create the Java Virtual Machine.
Error: A fatal exception has occurred. Program will exit.

可以看出, 这里缺少了 "+/-" 符号, 导致虚拟机启动异常, 修改后即可正常启动.

4.2 串行GC参数


-XX:+UseSerialGC 
# 使用 Serial & Serial Old 串行收集器(JDK 5以前的主要收集方式), 是client模式的默认设置.

4.3 并行GC参数(吞吐量优先)


-XX:+UseParNewGC 
# 使用ParNew & Serial Old收集器, 即对新生代使用并行收集, 提高收集效率(缩短Young GC的时间), 不推荐. 

-XX:+UseParallelGC 
# 使用Parallel Scavenge & Parallel Old并行收集器, 吞吐量优先, 会消耗更多内存, 是server模式的默认设置. 

-XX:+UseParallelOldGC 
# 对老年代使用Parallel Old并行收集器(JDK 6开始支持). 

-XX:ParallelGCThreads=20 
# 配置并行收集器的线程数, 即并行执行垃圾收集任务的线程个数. 
# 此值最好与CPU处理器的个数相同(默认即相同).

-XX:GCTimeRatio=49 
# 设置系统用作GC的时间比例, 如49, 则GC时间比为 1/(1+49) = 2%, 即Java用2%的时间来做垃圾收集. 
# 如果此值设置过大, 即GC时间太少导致GC无法完成, JVM会压缩新生代的大小以适应此配置. 

-XX:MaxGCPauseMillis=100 
# 设置每次新生代垃圾收集的最长毫秒值, 如果时间久而新生代的大小不足以支撑到此时间, 
# JVM会自动调整新生代的大小以满足此值. 若仍然无法满足, 则会调整GCTimeRatio. 

-XX:+UseAdaptiveSizePolicy 
# 使并行收集器自动设定Eden区的大小与相应的Survivor区的比例, 
# 以达到目标系统规定的最低响应时间或收集频率等. 建议在使用并行收集器时始终开启此选项.

4.4 并发GC参数(响应时间优先)


-XX:+UseConcMarkSweepGC 
# JDK 5开始提供支持, 以响应时间优先--即缩短Full GC的时间. 
# JVM会根据系统配置自行设置使用ParNewGC & CMS(Serial Old作为替补)收集器. 
# 建议在Heap Size较大且Full GC时间较长, 对响应时间的需求大于对吞吐量的需求, 能够承受垃圾回收线程和应用线程共享CPU资源等情况下使用. 

-XX:+UseCMSCompactAtFullCollection  
# CMS是不会移动内存的, 此参数设置在每次Full GC后对老年代空间进行压缩整理, 会影响性能, 但是能减少内存碎片. 

-XX:CMSInitiatingOccupancyFraction=70 
# 触发CMS收集器的内存占用阈值, 默认为90%: 当老年代内存空间使用率达到90%时, 就开始对老年代进行CMS并发垃圾收集. 
# 这个参数设置不当, 将发生promotion failed(晋升失败). 

-XX:CMSFullGCsBeforeCompaction=10 
# 由于并发收集器不对内存空间进行压缩整理, 所以运行一段时间后会产生"碎片", 使得运行效率降低. 此配置项用来设置在几次GC后触发一次内存整理. 
# 此配置项即将被移除(JDK 8已不建议使用).

4.5 G1 GC参数


-XX:+UseG1GC 
# 使用G1收集器

-XX:MaxGCPauseMillis=200    
# 设置回收器的最大停顿毫秒值, 这是一个概率目标, JVM将尽最大努力去实现它. 

-XX:G1ReservePercent=15
# 设置堆的临时上限, 以防止因堆扩大失败而导致的异常. 默认值是10\. 

-XX:G1HeapRegionSize=16
# 使用 G1 的 Java 堆细分为大小相等的区域(Region), 此选项是设置单个区域的大小, 
# 默认值是基于堆大小的一种人体工效划分, 最小值是1Mb, 最大值是32Mb.
# 人体工效: 根据平台相关的默认选择和根据需求动态垃圾回收的行为统称为人体工效, 
# 人体工效的作用就是可以通过少量的命令行选项就可以让JVM提供最合适的性能.

4.6 通用GC参数


-Xnoclassgc 
# 禁用类垃圾收集, 能提高性能. 

-XX:MaxHeapFreeRatio=70 
# GC过后堆的最大空闲空间比例, 避免过渡压缩

-XX:MinHeapFreeRatio=40 
# GC过后堆的最小空闲空间比例, 避免过度膨胀

-XX:MaxTenuringThreshold=5 
# 晋升老年代的最大年龄, 默认为15: 新生代对象在15次Minor GC后将被转移至老年代. -- 必须在0-15之间. 
# 如果设置为0, 等同于去掉了新生代的空间, 新生代对象将会越过Survivor区直接进入老年代, 很快就会占满老年代发生Full GC. 
# 同时, 这在老年代对象较多的应用中却可以提高效率. 
# 如果将此值调大, 则新生代对象会在Survivor区进行多次复制, 即增加了对象在新生代的存活时间. 

-XX:PretenureSizeThreshold=10 
# 晋升老年代的对象的大小, 默认为0\. 比如设为10M, 则超过10M的对象将越过Eden区, 直接存入老年代.

-XX:+UseThreadPriorities 
# 启用本地线程优先级API, 使java.lang.Thread.setPriority()生效, 不启用则无效

-XX:+DisableExplicitGC 
# 禁用写在程序中的System.gc(), 即禁止开发人员调用gc()方法影响性能. 

-XX:+ExplicitGCInvokesConcurrent 
# 配置System.gc()可以和应用程序一起并发执行. 
# System.gc()用来回收不用的内存, 此方法只是"建议"JVM回收内存, 不能强制回收, 具体回收时机由JVM决定. 

-XX:TargetSurvivorRatio=90 
# 允许90%的Survivor区被占用(JVM默认为50%), 提高对于Survivor区的使用率

-XX:SoftRefLRUPolicyMSPerMB=1 
# Soft Reference(弱引用)在虚拟机中比在客户机中存活的时间更长, 其清除频率可用此命令来控制. 
# 此命令用来指定每MB堆空间中Soft Reference存活的秒数, 默认值为1000毫秒: 对象的最后一个强引用被收集之后, 存活1秒钟. 
# 这是个近似值: Soft Reference只会在垃圾收集时才会被清除, 而垃圾收集并不总是发生. 可改为0, 客户机中不使用就立即清除.

4.7 其他说明

(1) 在内存调优中, 内存设置越大, 处理请求的效率也就越高, 但同时垃圾收集所需要的时间也就越长, 在垃圾收集期间的处理效率肯定会受影响, 因此需要作出相应的权衡.

(2) 关于 CMS 收集器的 Promotion Failed 和 Concurrent Mode Failure :

  • Promotion Failed, 晋升失败: 发生Young GC时, Eden区存活的对象 和 Eden区的From块中存活的对象, 两者的体积超过了Eden区中To块的大小, Young GC的悲观策略将使这些存活的对象都迁移到老年代, 而此时老年代的大小不足以容纳这些对象, 从而发生promotion failed , 程序将暂停很长时间.

  • Concurrent Mode Failure, 并发修改失败: 在执行GC的过程中, 恰好有对象要晋升至老年代, 而此时老年代的空间不足, 从而造成Concurrent Mode Failure.

  • 这两种情况都可能触发Full GC. 要注意不要一次性占用太多的内存, 或对JVM的配置进行一定的优化.

  • CMSInitiatingOccupancyFraction的设置技巧: 参考: CMSInitiatingOccupancyFraction计算公式(Xmx-Xmn) * (1 - CMSInitiatingOccupancyFraction/100) >= (Xmn - Xmn/(SurvivorRatior+2))进而推断出:CMSInitiatingOccupancyFraction <= ( (Xmx-Xmn) - (Xmn - Xmn/(SurvivorRatior+2) ) ) / (Xmx-Xmn) * 100

作者:瘦风的南墙
原文链接:https://www.cnblogs.com/shoufeng/p/9709464.html

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,752评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,100评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,244评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,099评论 1 286
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,210评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,307评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,346评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,133评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,546评论 1 306
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,849评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,019评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,702评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,331评论 3 319
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,030评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,260评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,871评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,898评论 2 351

推荐阅读更多精彩内容

  • 1、什么是垃圾回收? 程序的运行必然需要申请内存资源,无效的对象资源如果不及时处理就会一直占有内存资源,最终将导致...
    JavaLover阅读 868评论 0 1
  • GC中的垃圾特指于内存中不会再使用的对象,垃圾回收有很多算法:引用计数法标记压缩法复制算法分代,分区的思想 引用计...
    MicoCube阅读 364评论 0 1
  • 这篇文章是我之前翻阅了不少的书籍以及从网络上收集的一些资料的整理,因此不免有一些不准确的地方,同时不同JDK版本的...
    高广超阅读 3,832评论 0 18
  • JVM架构图分析 JVM被分为三个主要的子系统 (1)类加载器子系统(2)运行时数据区(3)执行引擎 1. 类加载...
    匆匆岁月阅读 1,015评论 1 19
  • 垃圾回收机制: 什么时候:什么时候开启垃圾回收(触发GC的条件),GC触发的条件有两种:①、程序调用System....
    caixuanxu阅读 2,601评论 0 3