垃圾收集器与内存分配策略
1. 概述
-
诞生
- 垃圾收集(Garbage Collection,GC),其历史远比Java久远,在1960年诞生于麻省理工学院的Lisp是第一门开始使用内存动态分配和垃圾收集技术的语言
-
垃圾收集完成的事
- 哪些内存需要回收
- 什么时候回收
- 如何回收
今天的内存动态分配与内存回收技术已经相当成熟,一切看起来都进入 了“自动化”时代,那为什么我们还要去了解垃圾收集和内存分配?
当需要排查各种内存溢出、内存泄漏问题时,当垃圾收集成为系统达到更高并发量的瓶颈时,我们就必须对这些“自动化”的技术实施必要的监控和调节。 -
运行时数据区域垃圾收集
-
程序计数器、虚拟机栈、本地方法栈
- 这些区域随线程而生,随线程而灭,栈中的栈帧随着方法的进入和退出而有条不紊的执行出栈和入栈操作
- 因此这几个区域的内存分配和回收都具备确定性,当方法结束或者线程结束,内存自然就回收了
-
Java堆、方法区
- 堆和方法区有着很显著的不确定性
- 一个接口的多个实现类需要的内存可能会不一样, 一个方法所执行的不同条件分支所需要的内存也可能不一样,只有处于运行期间,我们才能知道程序究竟会创建哪些对象,创建多少个对象,这部分内存的分配和回收是动态的
- 垃圾收集器所关注的正是这部分内存该如何管理,“内存”分配与回收也仅仅特指这一部分内存
-
调用垃圾收集
- System.gc();
-
2. 对象已死?
-
对象回收
- Java世界中几乎所有的对象实例都存放在堆中
- 垃圾收集器在对堆进行回收前,要先确认这些对象中哪些”存活“,哪些已”死去“
死去,不可能再被任何途径使用的对象。
-
引用计数算法
-
原理
- 在对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加一;当引用失效时,计数器值就减一;任何时刻计数器为零的对象就是不可能再被使用的
-
优缺点
- 优点
- 原理简单
- 判定效率高
- 缺点
- 需额外占用内存空间来进行计算
- 很多例外情况需考虑,必须配合大量额外处理才能保证正确工作,如对象间互相循环引用
对象之间互相循环引用,两个对象已经不可能再被访问,但因为它们之间互相引用,导致引用计数都不为零,也就无法回收。
- 优点
-
应用案例
- 微软COM(Component Object Model)技术
- 使用ActionScript 3的FlashPlayer
- Python
- Squirrel等
-
-
可达性分析算法
- 原理
- 通过一系列称为“GC Roots”的根对象作为起始节点集,从这些节点开始,根据引用关系向下搜索,搜索过程所走过的路径称为“引用链”(Reference Chain),如果某个对象到GC Roots间没有任何引用链相连,或者用图论的话来说就是从GC Roots到这个对象不可达时,则证明此对象是不可能再被使用的,如图中object5、6、7不可达
-
GC Roots完整集合
- Java中固定可作为GC Root的对象
- 在虚拟机栈(栈帧中的本地变量表)中引用的对象,如各个线程被调用的方法堆栈中使用到的参数、局部变量、临时变量等
- 在方法区中类静态属性引用的对象,如Java类的引用类型静态变量
- 在方法区中常量引用的对象,如字符串常量池里的引用
- 在本地方法栈中JNI(Native方法)引用的对象
- Java虚拟机内部的引用,如基本数据类型对应的Class对象、一些常驻的异常对象、系统类加载器
- 所有被同步锁持有的对象
- 反应Java虚拟机内部情况的JM XBean、JVM TI中注册的回调、本地代码缓存等
- 临时性加入
- 分代收集和局部回收(Partial GC)
- Java中固定可作为GC Root的对象
-
应用案例
- Java
- C#
- Lisp等
- 原理
-
再谈引用
-
在JDK 1.2版之前
- 如果reference类型的数据中存储的数值代表的是另外一块内存的起始地址,就称该reference数据是代表某块内存、某个对象的引用
-
在JDK 1.2版之后,Java对引用的概念进行了扩充,引用分为4种,引用强度依次减弱
-
强引用(Strongly Re-ference)
- 最传统的“引用”的定义,是指在程序代码之中普遍存在的引用赋值,即类似“Objectobj=new Object()”这种引用关系
- 只要强引用关系还存在,垃圾收集器就永远不会回收掉被引用的对象
-
软引用(Soft Reference)
- 用来描述一些还有用,但非必须的对象
- 只被软引用关联的对象,在系统将要发生内存溢出异常前,会把这些对象列进回收范围之中进行第二次回收, 如果这次回收还没有足够的内存,才会抛出内存溢出异常
- 在JDK 1.2版之后提供了SoftReference类来实现软引用
-
弱引用(Weak Reference)
- 也是用来描述那些非必须对象,但是它的强度比软引用更弱一些
- 被弱引用关联的对象只能生存到下一次垃圾收集发生为止,当垃圾收集器开始工作,无论当前内存是否足够,都会回收掉只被弱引用关联的对象
- 在JDK 1.2版之后提供了WeakReference类来实现弱引用
-
虚引用(Phantom Reference)
- 也称为“幽灵引用”或者“幻影引用”,它是最弱的一种引用关系,一个对象是否有虚引用的存在,完全不会对其生存时间构成影响,也无法通过虚引用来取得一个对象实例
- 为一个对象设置虚引用关联的唯一目的只是为了能在这个对象被收集器回收时收到一个系统通知
- 在JDK 1.2版之后提供了PhantomReference类来实现虚引用
-
-
-
生存还是死亡--对象回收的过程
即使在可达性分析算法中判定为不可达的对象,也不是“非死不可”的,这时候它们暂时还处于“缓刑”阶段,要真正宣告一个对象死亡,至少要经历两次标记过程。
第一次标记,如果对象在进行可达性/引用计数分析后,发现没有与GC Roots相连接的引用链,那它将会被第一次标记
-
进行一次筛选,筛选的条件是此对象是否有必要执行finalize()方法
- 对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,那么虚拟机将这两种情况都视为“没有必要执行”
- 对象被判定为确有必要执行finalize()方法
对象被判定执行finalize()方法,对象将会被放置在一个名为F-Queue的 队列之中
-
第二次标记,收集器将对F-Queue中的对象进行第二次小规模的标记
- 如果对象重新与引用链上的任何一个对象建立关联,譬如把自己(this关键字) 赋值给某个类变量或者对象的成员变量,那在第二次标记时它将被移出“即将回收”的集合
- 如果对象这时候还没有逃脱,那基本上它就真的要被回收
-
对象没有逃脱,稍后会由一条由虚拟机自动建立的、低调度优先级的Finalizer线程去执行它们的finalize()方法
这里所说的“执行”是指虚拟机会触发这个方法开始运行,但并不承诺一定会等待它运行结束。这样做的原因是,如果某个对象的finalize()方法执行缓慢,或者更极端地发生了死循环,将很可能导致F-Queue队列中的其他对象永久处于等待,甚至导致整个内存回收子系统的崩溃。
3. 回收方法区
-
方法区回收
《Java虚拟机规范》中提到过可以不要求虚拟机在方法区中实现垃圾收集
-
方法区回收由于苛刻的判定条件,其区域垃圾收集的回收成果往往较低
在Java堆中,尤其是在新生代中,对常规应用进行一次垃圾收集通常可以回收70%至99%的内存空间。
在大量使用反射、动态代理、CGLib等字节码框架,动态生成JSP以及OSGi这类频繁自定义类加载器的场景中,通常都需要Java虚拟机具备类型卸载的能力,以保证不会对方法区造成过大的内存压力
-
垃圾收集内容
- 废弃常量
- 不再使用的类型
-
常量回收
- 回收废弃常量与回收Java堆中的对象非常类似
- 没有任何字符串对象引用常量池中的常量,且虚拟机中也没有其他地方引用这个字面量,如果在这时发生内存回收,而且垃圾收集器判断确有必要的话, 这个常量就将会被系统清理出常量池
- 常量池中其他类(接口)、方法、字段的符号引用也与此类似
-
类型回收
-
判定一个类型是否属于“不再被使用的类”,需要同时满足下面三个条件:
- 该类所有的实例都已经被回收,也就是Java堆中不存在该类及其任何派生子类的实例
- 加载该类的类加载器已经被回收,这个条件除非是经过精心设计的可替换类加载器的场景,如OSGi、JSP的重加载等,否则通常是很难达成
- 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法
Java虚拟机被允许对满足上述三个条件的无用类进行回收,这里说的仅仅是“被允许”,而并不是和对象一样,没有引用了就必然会回收
-
类型回收控制参数
- 回收控制参数
- -Xnoclassgc
- 查看类加载信息
- -verbose:class,在Product版的虚拟机中使用
- 查看类卸载信息
- -XX:+TraceClass-Loading,在Product版的虚拟机中使用
- -XX:+TraceClassUnLoading,需要FastDebug版的虚拟机支持
- 回收控制参数
-