GC垃圾回收(1)- 回收算法与分代模型

1. 什么是garbage垃圾?

没有任何引用指向的一个对象或者多个对象(循环引用),就是垃圾

1.1 Java与C++对于垃圾处理的区别

  • Java
    GC处理垃圾
    开发效率高,执行效率低
  • C++
    手动处理垃圾
    忘记回收 -> 会导致内存泄漏
    回收多次 -> 会造成非法访问
    开发效率低,执行效率高

2. 怎么定位垃圾

Java堆中存放着几乎所有的对象实例,垃圾回收器在堆进行垃圾回收前,首先要判断这些对象那些还存活,哪些成为了”垃圾“。定位“垃圾”有如下算法:
(1)引用计数法(ReferenceCount)
(2)根可达算法(RootSearching)

2.1 引用计数法(ReferenceCount)

引用计数法描述的算法为:给对象增加一个引用计数器,每当有一个地方引用它时,计数器就+1;当引用失效时,计数器就-1;任何时刻计数器为0的对象就是不能再被使用的,成为“垃圾”。

引用计数法实现简单,判定效率也比较高,在大部分情况下都是一个比较好的算法。比如Python语言就是采用的引用计数法来进行内存管理的。

但是,在主流的JVM中没有选用引用计数法来管理内存,最主要的原因是 引用计数法无法解决对象的循环引用问题

2.2 根可达算法(RootSearching)

Java并不采用引用计数法来判断对象是否已成为“垃圾”,而采用“根可达算法”来判断对象是否存活(同样采用此法的还有C#、Lisp-最早的一门采用动态内存分配的语言)。

此算法的核心思想:通过一系列称为“GC roots”的对象作为起始点,从这些节点开始向下搜索,搜索走过的路径称为“引用链”,当一个对象到 GC roots 没有任何的引用链相连时(从 GC roots 到这个对象不可达)时,证明此对象不可用,是垃圾。

哪些实例可以作为GC roots?

  • JVM stack Java 虚拟机栈(栈帧中的本地变量表)引用的对象
  • native method stack 本地方法栈中引用的对象
  • run-time constant 运行时常量池
  • static references in method area 方法区中静态变量引用的对象

如图:


Root Searching.png

3. GC Algorithms 垃圾回收算法

对存活对象和垃圾对象进行区分之后就需要进行回收了,垃圾回收算法有以下3种:

  • Mark-Sweep (标记清除)
  • Copying(复制)
  • Mark-Compact(标记压缩 或 标记整理)

3.1 Mark-Sweep (标记清除)

“标记清除”算法是最基础的回收算法。算法分为标记和清除两个阶段:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象(标记过程使用根可达算法)。后续的回收算法都是基于这种思路并对其不足加以改进而已。

“标记清除”算法的不足主要有两个:

  • 效率问题:标记和清除这两个过程的效率都不高
  • 空间问题:标记清除后会产生大量不连续的内存碎片,空间碎片太多可能会导致以后在程序运行中需要分配较大对象时,无法找到足够连续内存而不得不提前触发另一次垃圾回收。
标记清除算法.png

3.2 Copying(复制)

“复制”算法是为了解决“标记清除”的效率问题。它将可用内存按容量划分为大小相等的两块,每次只使用其中一块。当这块内存需要进行垃圾回收时,会将此区域还存活着的对象复制到另一块上面,然后再把已经使用过的内存区域一次清理掉。这样做的好处是每次都是对整个半区进行内存回收,内存分配时也就不需要考虑内存碎片等的复杂情况,只需要移动堆顶指针,按顺序分配即可。

此算法实现简单,运行高效;不足之处是占用内存多。


复制算法.png

3.3 Mark-Compact(标记压缩)

复制回收算法在对象存活率较高时会进行比较多的复制操作,效率会变低。因此在老年代一般不能使用复制算法。

针对老年代的特点,提出了一种“标记整理算法”。标记过程仍与“标记清除”过程一致,但后续步骤不是直接对可回收对象进行清理,而是让所有存活对象向一端移动,然后直接清理掉边界以外的内存。

好处是能整理出连续的内存,不会产生碎片,方便对象分配,也不会将可用内存减半;
不足:要扫描两次,还要移动对象,效率偏低。

标记压缩(整理)算法.png

4. JVM逻辑分代模型(用于分代垃圾回收算法)

这是部分垃圾回收器使用的模型

除Epsilon ZGC Shenandoah之外的GC都是使用逻辑分代模型
G1是逻辑分代,物理不分代
除此之外不仅逻辑分代,而且物理分代

分代垃圾回收算法,并没有新思想,只是根据对象存活周期的不同将内存划分为几块。
一般是把Java堆分为新生代和老年代。在新生代中,每次垃圾回收都有大批对象被回收,只有少量存活,因此采用复制算法;而老年代中对象存活率高、没有额外空间对它进行分配担保,就必须采用"标记清理"或者"标记压缩"算法。

现在的商用虚拟机(包括HotSpot)都是采用这种收集算法来回收新生代
新生代中98%的对象都是"朝生夕死"的,所以并不需要按照1 : 1的比例来划分内存空间,而是将内存(新生代内存)分为一块较大的Eden(伊甸园)空间和两块较小的Survivor(幸存者)空间,每次使用Eden和其中一块Survivor(两个Survivor区域一个称为From区,另一个称为To区域)。当回收时,将Eden和Survivor中还存活的对象一次性复制到另一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。
当Survivor空间不够用时,需要依赖其他内存(老年代)进行分配担保。
HotSpot默认Eden与Survivor的大小比例是8 : 1,也就是说Eden:Survivor From : Survivor To = 8:1:1。所以每次新生代可用内存空间为整个新生代容量的90%,而剩下的10%用来存放回收后存活的对象。


堆内存逻辑分区.png

4.1 对象从出生到消亡

对象会首先分配到stack栈中,如果栈中分配不下了,会分配到Eden区中。Eden区进行垃圾回收后,存活对象被复制到s1区,清空Eden区。当触发第二次垃圾回收时,将Eden区、s1区存活对象复制到s2区,清空eden和s1......

如此循环进行,对象被复制一次年龄加1,当Survivor区对象的复制年龄超过限制时,进入Old区。

通过参数:-XX:MaxTenuringThreshold配置对象被复制的最大次数。

对象什么时候进入老年代?
对象头mark word有4位是记录对象年龄的,4位二进制最大是15,也就是说年龄最大为15

  • 超过XX:MaxTenuringThreshold指定次数(YGC)
    • Parallel Scavenge回收器 15
    • CMS回收器 6
    • G1回收器 15
  • 动态年龄
    • s1 --> s2 超过50%
    • 把年龄最大的放入old

4.1.1 对象的分配

  • 栈上分配

    • 线程私有小对象
    • 无逃逸(只在某代码段中使用)
    • 支持标量替换(用普通类型属性代替对象)
    • 优化时无需调整
  • 线程本地分配TLAB(Thread Local Allocation Buffer)

    • 占用eden,默认1%(为避免对象分配时进行空间争用线程同步影响效率,每个线程独占eden区1%的空间)
    • 多线程时不用竞争eden就可以申请空间,提高效率
    • 小对象
    • 优化时无需调整
  • 老年代

    • 大对象

对象分配过程总结

对象分配过程总结.png

  • eden

4.2 GC概念

GC概念.png
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350