垃圾回收算法
01、垃圾回收的过程
在分代收集算法下:
- 当
JVM
内存不足时,就会触发年轻代得GC
; - 首先,会通过可达性分析来判断哪些对象垃圾对象;
- 接着,将这些对象放入死亡队列,进行对象得死亡判断与回收;
如果上述GC
后,内存还不够。就会触发老年代GC
。如果内存还不够,就会触发Full GC
。
02、三种GC
(1)Minor GC
- 在年轻代进行垃圾回收;
- 这种
GC
速度快、效率高、回收率高; - 当程序内存不足时,触发。
(2)Major GC
- 在老年代进行垃圾回收;
- 这种
GC
速度慢、效率慢、回收率低; - 当
Minor GC
后,还是没法满足后,就会触发Major GC
;
(3)Full GC
- 回收整个堆的对象
- 当
Minor GC
、Major GC
都没满足要求后,才会进行的GC
Full GC
在java7、8
对于方法区的区别。
一、如何确定垃圾
01、引用计数
这里认为一个对象的引用没有被任何人持有的话,这个对象就是垃圾。
当一个对象被赋值给其他人时,其引用计数就会
+1
。当引用对象不再引用它时,其引用计数就会-1
。当GC
发生时,就会认为这个对象是可以清除得。
1、优缺点分析
引用计数得优点在于快。当一个对象得引用计数为0时,就可以被GC
了,不需要进行可达性分析;
缺点在于无法处理循环引用,如上图红色部分。
现代
JVM
已经不使用这种方法
02、可达性分析
可达性分析会设置某些对象是GC Root
,凡是某个对象通过引用链可以达到GC Root
对象得话,就认为这个对象是活对象。反之,认为它是垃圾对象。
1、java
中哪些对象是GC Root
对象?
- 所有得
Thread
对象 - 栈帧中得局部变量表
- 方法区得静态成员
-
JNI
持有得引用 Monitor
- 其他
JVM
持有得GC Root
:比如说:如果年轻代在GC
时,老年代里面得所有对象都是GC Root
。
二、对象得死亡判定
通过可达性分析后,将不可达对象放入死亡队列;垃圾回收器调用这些不可达对象得
finalize
方法最终判断是否回收他。也就是说我们可以通过覆盖
finalize
方法,让这个对象永远都不会垃圾回收。但是非常不推荐使用。
三、垃圾回收算法
java
中得gc
不仅要回收对象,还要压缩空间。压缩空间目的是让程序有更多连续内存使用,减少内存的碎片化。
GC
分代收集算法
01、分代假设
研究发现,JVM
中大部分对象都是用完后,立马就不再使用了。
02、内存分代
JVM
将对象分为3种年纪:
- 年轻代:
Young
Eden(TLABs)
Survivor
- 老年代:
Tenured(Old)
- 永久代:
PermGen/Metaspace
(1)年轻代垃圾回收
- 当
Eden
内存不够时,会触发年轻代GC
。此时,Eden
内对象要不然作为垃圾回收了,要不然就进入S1
区; - 此时
S
区中对象得年龄会加1,并将S1
区对象汇合到S2
; - 汇合后,凡是对象超过
15
岁,就可以进入老年代了;
这里会涉及到一个GC
调优得现象:对象过早提升。
就是由于Eden
区域过小,导致每次创建大对象时,Eden
区域内存不够,只能在老年代上分配。这时候,就需要将Eden
内存大小调大一点。
(2)老年代垃圾回收
老年代垃圾回收时,只会将垃圾对象清除掉,然后合并一下碎片空间。
相关知识
1、GC
的三种实现过程
Mark-and-Sweep
:标记清除
Mark-Sweep-Compact
:标记、清除、压缩
Mark-and-Copy
:标记、拷贝
2、 GC
的Mark
阶段
Stop The World
(STW
)
STW
是指所有应用线程都到达safe point
点时,为了GC
工作需要,会停止所有的应用线程。这时候,GC
线程就可以开始扫描GC Roots
。
这样直观的感觉就是应用卡顿,这也是GC
调优的关键指标。
注意:GC
的停顿与堆大小无关,只与活对象大小有关。有时候增加堆大小不仅不能减少延迟,反而会增加延迟。
垃圾回收器
一、Serial GC
:串行垃圾回收器
单线程串行GC:Serial、Serial Old
1、年轻代:Mark-Copy
2、老年代:Mark-Sweep-Compact
3、相关配置:
-
-XX:+UseSerialGC
:开启Serial GC
-
-XX:+PrintGCDetails
:开启打印GC详情 -
-XX:+PrintGCDateStamps
:开启打印GC时间戳 -
-xx:+PrintGCTimeStamps
:开启打印GC时间戳
4、应用介绍
(1)在JVM
启动参数上如下参数
-XX:+UseSerialGC -XX:+PrintGCDetails -XX:+PrintGCDateStamps -XX:+PrintGCTimeStamps
-XX
:代表这是一个非标准JVM参数,只在hotSpot
虚拟机有效
+
:开始开启
(2)GC
日志的分析
# 时间戳 : GC花费的时间
2020-04-02T14:20:29.653+0800: 5.054:
# GC开启的原因 GC开始的时间戳:
[GC (Allocation Failure) 2020-04-02T14:20:29.653+0800: 5.054:
# DefNew表示我们使用的串行垃圾回收器:回收前年轻代大小->回收后年轻代大小(年轻代总的大小),花费的时间
[DefNew: 151750K->5184K(157376K), 0.0180036 secs]
# 回收堆的大小 -> 回收堆的大小(堆的总大小),花费的时间
162889K->24012K(506944K), 0.0180394 secs]
# 时间:在用户模式下花费的时间,在系统模式下花费的时间,真实花费的时间
[Times: user=0.02 sys=0.00, real=0.02 secs]
二、Paraller GC
:并行垃圾回收器
- 年轻代:
Mark-Copy
- 老年代:
Mark-Sweep-Compact
使用多个线程并发标记清除。
包含的垃圾回收器:ParNew
、CMS
、ParallelScavenge
、Parallel Old
并发垃圾回收器经历了俩个阶段:
- 早期的时候,开发出
ParallelScavenge
、Parallel Old
,分别回收年轻代和老年代 - 后来又开发出:
ParNew
、CMS
三、Concurrent GC
:并发垃圾回收器
CMS:Concurrent Mark Sweep
1、
paraller
vsConcurrent
并行、并发
2、优点
之前的垃圾回收器运行时,需要STW
,而这个时间可能很长。CMS
为了减少STW
的暂停时间,就提出在部分时刻才需要所有应用线程停止,其他的时候应用线程和GC线程一样,一起工作。
3、缺点
-
CMS
只能清除老年代,所以它需要搭配Serial
、ParNew
来清除年轻代。 -
CMS
垃圾回收器只能实现Mark-Sweep
,无法做到Compact
,因为应用线程在跟GC线程一起运行的;
4、过程
- 初始标记:
GC roots
直接引用 - 并行标记:大多数的活对象
- 重新标记:并发标记,因为上次并行走的时候,可能标记的不完全准确
- 并行清理: