如何减少长时间的 GC 停顿?

简书 涤生
转载请注明原创出处,谢谢!
如果读完觉得有收获的话,欢迎点赞加关注。

作者:Ram Lakshmanan,原文:How to Reduce Long GC Pauses

垃圾回收是非常必要的,但是如果处理不好,它会成为性能杀手。采取以下步骤以确保 GC 停顿时间最少且最短。

长时间的 GC 停顿对应用程序是不利的,它会影响服务的 SLA,进而导致糟糕的用户体验,并对核心应用程序的服务造成严重损害。因此,在本文中,我列出了导致长时间 GC 停顿的关键原因以及解决这些问题的可能的解决方案。

1. 高速率创建对象

如果你的应用程序的对象创建率很高,那么为了跟上它,垃圾回收率也将会很高。高垃圾回收率也会增加 GC 停顿时间。因此,优化应用程序以创建更少的对象是减少长 GC 停顿的有效策略。这可能是一个耗时的工作,但百分百值得去做。为了优化应用程序中的对象创建速率,可以考虑先使用 Java 分析器来进行分析,例如 JProfilerYourKit 或 JVisualVM,通过这些分析器可得出以下信息报告:

  • 创建了哪些对象?
  • 创建这些对象的速率是多少?
  • 它们在内存中占用多少空间?
  • 谁在创建了它们?

始终尝试去优化占用最大内存量的对象。

提示: 如何计算对象创建速率

将你的 GC 日志上传到通用 GC 日志分析器工具 GCeasy。该工具将报告对象创建率。在“对象统计信息”中将列出“平均创建率”。此项将报告对象创建率。力争使该值保持较低。请参见下图(摘自 GCeasy 生成的报告的目录),显示“平均创建速度”为 8.83 mb.sec

对象统计信息

2. 年轻代空间不足

当年轻代过小时,对象会过早地提升到老年代。从老年代收集垃圾比从年轻代收集垃圾要花费更多的时间。因此,增加年轻代的大小有可能减少长时间的 GC 停顿。可以通过设置两个 JVM 参数之一来增加年轻一代的大小 -Xmn :指定年轻代的大小。 -XX:NewRatio :指定年轻代相对于老年代的大小比例。例如,设置 -XX:NewRatio=2 表示年轻代与老年代之间的比率为 1:2。年轻代的大小将是整个堆的 1/3。因此,如果堆大小为 2 GB,则年轻代大小将为 2G / 3 = 667 MB。

3. 选择 GC 算法

GC 算法对 GC 停顿时间有很大的影响。如果你是 GC 专家或打算成为一个(或你的团队中的有人是 GC 专家),你可以调整 GC 参数配置以获得最佳 GC 停顿时间。如果你没有大量的 GC 的专业知识,那么我建议使用 G1 GC 算法,因为它有自动调节的能力。在 G1 中,可以使用系统属性 -xx:MaxGCPauseMillis来设置 GC 预期最大停顿时间。例如:

 -XX:MaxGCPauseMillis=200

按照上面的例子,最大 GC 停顿时间设置为 200 毫秒。这是一个软目标,JVM 将尽力实现它。

4. 进程使用了 Swap

有时由于物理内存不足(RAM),操作系统可能会将应用程序暂时不用的数据从内存交换出去。交换动作是非常昂贵的,因为它需要访问磁盘,这比物理内存访问要慢得多。

依我之见,在生产环境中,任何一个重要的应用程序都不应该交换。当进程使用了 Swap 时,GC 将需要很长的时间才能完成。

下面的脚本来自 StackOverflow (感谢作者),当执行脚本时,将显示所有正在发生交换的进程。请确保你的应用程序进程没有使用 Swap。

#!/bin/bash 
# Get current swap usage for all running processes
# Erik Ljungstrom 27/05/2011
# Modified by Mikko Rantalainen 2012-08-09
# Pipe the output to "sort -nk3" to get sorted output
# Modified by Marc Methot 2014-09-18
# removed the need for sudo
SUM=0
OVERALL=0
for DIR in `find /proc/ -maxdepth 1 -type d -regex "^/proc/[0-9]+"`
do
 PID=`echo $DIR | cut -d / -f 3`
 PROGNAME=`ps -p $PID -o comm --no-headers`
 for SWAP in `grep VmSwap $DIR/status 2>/dev/null | awk '{ print $2 }'`
 do
 let SUM=$SUM+$SWAP
 done
 if (( $SUM > 0 )); then
 echo "PID=$PID swapped $SUM KB ($PROGNAME)"
 fi
 let OVERALL=$OVERALL+$SUM
 SUM=0
done
echo "Overall swap used: $OVERALL KB"</pre>

如果发现进程使用了 Swap 分区,则可以执行下列操作之一:

  • 分配更多的物理内存。
  • 减少在服务器上运行的进程的数量,以便它可以释放内存(RAM)。
  • 减少应用程序的堆大小(我不建议这么做,因为它会导致其他副作用。不过,它可能会解决你的问题)。

5. 调整 GC 线程数

对于 GC 日志中报告的每个 GC 事件,会打印用户、系统和实际执行时间。例如:

[Times: user=25.56 sys=0.35, real=20.48 secs]

要了解这些时间之间的区别,请阅读本文(我强烈建议在继续阅读本节之前阅读该篇文章)。如果在 GC 事件中,您始终注意到 real 时间并不显著小于 user 时间,那么它可能指示没有足够的 GC 线程。考虑增加 GC 线程数。假设 user 时间为 25s,并且将 GC 线程计数配置为 5,那么 real 应该接近 5s(因为 25s/5=5s)。

警告:添加太多的 GC 线程将消耗大量 CPU,从而占用应用程序的资源。因此,在增加 GC 线程数之前,需要进行充分的测试。

6. 后台 I/O 活动

如果有大量的文件系统 I/O 活动(即发生大量的读写操作),也可能导致长时间的 GC 停顿。此繁重的文件系统 I/O 活动可能不是由应用程序引起的。可能是由于运行在同一服务器上的另一进程造成的。但它仍然会导致应用程序遭受长时间的 GC 停顿。这里是一篇 来自 LinkedIn工程师精彩文章,详细介绍了这个问题。

当有严重的 I/O 活动时,你会注意到 real 的时间明显高于 user 的时间。例如:

[Times: user=0.20 sys=0.01, real=18.45 secs]

当这种情况发生时,以下是一些可能的解决方案:

  • 如果高 I/O 活动是由应用程序引起的,那么优化它。
  • 消除在服务器上导致高 I/O 活动的进程。
  • 将应用程序移动到 I/O 活动较少的其他服务器。

提示: 如何监视 I/O 活动

类 Unix系统 中,你可以使用的 SAR 命令(系统活动情况报告)监视 I/O 活动。例如:

sar -d -p 1

上面的命令每 1 秒会报告一次读取/秒和写入/秒的统计数据。有关 SAR 命令的更多细节,请参阅本教程.。

7. System.gc() 调用

当调用 System.gc() or Runtime.getRuntime().gc() 方法时,它将导致 stop-the-world 的 Full GC。在 Full GC 期间,整个 JVM 被冻结(即在此期间不会执行任何用户活动)。System.gc() 调用一般来源于以下情况:

  1. 开发人员可能会显式地调用 System.gc() 方法。
  2. 使用的第三方库、框架,有时甚至是应用程序服务器。其中任何一个都可能调用 System.gc() 方法。
  3. 还可以通过使用 JMX 从外部工具(如 VisualVM)触发。
  4. 如果你的应用程序正在使用 RMI,那么 RMI 会定期调用 System.gc() 。可以使用以下系统属性配置此调用间隔:
-Dsun.rmi.dgc.server.gcInterval=n
-Dsun.rmi.dgc.client.gcInterval=n

评估是否显式调用 System.gc() 是绝对必要的。如果不需要,请把它删掉。另一方面,可以通过传递 JVM 参数来强制禁用 System.gc() 调用 -XX:+DisableExplicitGC。有关 System.gc() 问题和解决方案的完整详细信息请参阅本文

提示: 如何知道是否显示调用了 System.gc()

将 GC 日志上传到通用 GC 日志分析器工具GCeasy。此工具有一个名为GC Causes的部分。如果由于System.gc()调用而触发 GC 活动,则此部分将报告该情况。请看下图(摘自 GCeasy 生成的报告目录),显示了 System.gc() 在这个应用程序的生命周期中被做了四次。

GC Causes

警告:所有上述战略只有经过彻底的测试和分析才能推广到生产。所有策略可能不一定适用于你的应用程序。如果不当使用可能会导致负面的结果。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容