2. 垃圾收集器与内存分配策略
2.1 判断对象是否死亡的方法
2.1.1 引用计数法
引用计数算法(Reference Counting):给对象中添加一个引用计数器,每当有一个地方引用它时,计数器值就加1;当引用失效时,计数器值就减1;任何时刻计数器为0的对象就是已经死去的对象。
它的缺点在于很难解决对象之间互相循环引用的问题。
2.1.2 可达性分析算法
可达性分析算法(Reachability Analysis):通过一系列的称为“GC Roots”的对象作为起始点,从这些节点开始向下搜索,搜索所走过的路径称为引用链(Reference Chain),当一个对象到GC Root没有任何引用链相连时,则证明此对象是不可用的。
在Java语言中,可作为GC Roots的对象有:虚拟机栈中引用的对象、方法区中类静态属性引用的对象、方法区中常量引用的对象、本地方法栈中引用的对象。
2.1.3 引用
引用分为强引用(Strong Reference)、软引用(Soft Reference)、弱引用(Weak Reference)、虚引用(Phantom Reference)4种,这4种引用强度依次减弱。
- 强引用就是代码中最普遍的。如“Object obj = new Object()”。
- 软引用时用来描述一些还有用但并非必须的对象。只在系统将要发生内存溢出异常之前才会回收。
- 弱引用也是用来描述非必需对象,程度较软应用更低。无论内存是否足够,一旦垃圾收集器工作,弱引用的对象就会被回收。
- 虚引用也称为幽灵引用或者幻影引用,它是最弱的一种引用关系。其唯一作用就是能在这个对象呗垃圾收集器回收时收到一个系统通知。
2.1.4 求生之路
这个世界没谁是非死不可的,也没有哪个对象是一定要被回收的。
在可达性分析算法中,要真正宣告一个对象死亡,至少要经历两次标记过程:如果对象在进行可达性分析后发现没有与GC Roots相连接的引用链,那它将会被第一次标记并且进行一次筛选,筛选的条件时此对象是否有必要执行finalize()方法。当对象没有覆盖finalize()方法,或者finalize()方法已经被虚拟机调用过,虚拟机将这两种情况都视为没有必要执行。有必要执行finalize()方法的对象被放到F-Queue队列中配对等待死亡的命运。
只要对象在finalize()方法中重新与引用链上的任何一个对象建立关联就可成功自救。
(没人救得了你,除了自己)
任何一个对象的finalize()方法只会被系统自动调用一次,如果对象面临下一次回收,它的finalize()方法不会被再次执行。
(自救的机会只有一次,别妄想重来)
2.1.5 回收方法区
方法区一般不回收,并且它的回收效率远低于新生代。
方法区的垃圾收集主要回收两部分:废弃常量和无用的类。
判定废弃常量的方法:没有其他地方引用了这个字面量。
判定废弃类的方法:
- 该类的所有实例都已经被回收,也就是Java堆中不存在该类的任何实例。
- 加载该类的ClassLoader已经被回收。
- 该类对应的java.lang.Class对象没有在任何地方被引用,无法在任何地方通过反射访问该类的方法。
2.2 垃圾收集算法
2.2.1 标记-清除算法
标记-清除算法(Mark-Sweep)算法分为标记和清除两个阶段:首先标记处所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
不足之处:1.效率不高,2.产生的空间碎片太多。
2.2.2 复制算法
复制算法(Copying)算法的出现是为了解决标记-清除算法的效率问题。它将可用内存按容量划分为大小相等的两块,每次只是用其中的一块。当这一块的内存用完了,就将还存活的对象复制到另一块,然后把已使用的内存空间一次清理掉。代价是内存减小一半。
有一种改进方案是将内存分为一块较大的Eden空间和两块较小的Survivor空间,每次使用Eden和其中一块Survivor。当回收时,将Eden和Survivor中还存活的对象一次性复制到另外一块Survivor空间上,最后清理掉Eden和刚才用过的Survivor空间。HotSpot虚拟机默认Eden和Survivor空间的大小比例是8:1。
2.2.3 标记-整理算法
复制算法的缺点在于需要对存活率较高的对象进行较多次的复制操作,效率较低。
标记-整理算法(Mark-Compact)的标记过程仍然与“标记-清除”算法一样,但后续的步骤不是直接对可回收对象进行清理,而是让所有存活对象都向一端移动,然后直接清理掉端边界以外的内存。
2.2.4 分代收集算法
当前商业虚拟机采用的就是分代收集算法(Generational Collection),这种算法根据对象存活周期的不同将堆内存划分为几块,如新生代和老年代。在新生代采用复制算法,用老年代的空间对它进行分配担保。而老年带中因为对象存活率高,没有额外空间对它进行分配担保,就必须使用“标记-清理”或者“标记-整理”算法进行回收。
2.3 垃圾收集器
2.3.1 Serial收集器
Serial收集器是最基本、发展历史最悠久的收集器。这是一个单线线程收集器,但它大单线程的意义不仅仅说明它会使用一个CPU或一条收集线程去完成垃圾收集工作,更重要的是它在进行垃圾收集时,必须暂停其他所有的工作线程,直到它收集结束。
优点是简单高效,缺点是用户体验极差。
2.3.2 ParNew收集器
ParNew收集器其实就是Serial收集器的多线程版本,除了使用多条线程收集垃圾之外,其余行为与Serial一样。
有点使得在垃圾回收时,其他用户线程也能运行。
2.3.3 Paralle Scavenge收集器
Paralle Scavenge收集器是一个新生代收集器,它也是采用复制算法的收集器。
其特点再与它的目标是达到一个可控制的吞吐量(Throughput)。所谓吞吐量就是CPU用于运行用户代码的时间与CPU总消耗时间的比值。由于与吞吐量关系密切,Parallel Scavenge收集器也经常被称为“吞吐量优先”收集器。
2.3.4 Serial Old收集器
Serial Old是Serial收集器的老年带版本,它同样是一个单线程收集器。
2.3.5 Parrallel Old收集器
Parrallel Old是Parrallel Scavenge收集器的老年代版本,使用多线程和“标记-整理”算法。
2.3.6 CMS收集器
CMS(Concurrent Mark Sweep)收集器是一种以最短回收停顿时间为目标的收集器,是目前主流的收集器。该收集器旨在给用户带来较好的体验,尤其重视服务的响应速度,希望系统停顿时间最短。
CMS收集器是基于“标记-清除”算法实现的。过程分为4步:
1.初始标记
2.并发标记
3.重新标记
4.并发清除
CMS的优点在于并发收集、低停顿。
缺点在于1.对CPU资源非常敏感,2.无法处理浮动垃圾(Floating Garbage),3.CMS是基于“标记-清除”算法实现,会产生大量空间碎片。
2.3.7 G1收集器
G1(Garbage-First)收集器的特点:
1.并行与并发:充分利用多CPU的硬件优势缩短Stop-the-World停顿时间,通过并发的方式让Java程序继续执行。
2.分代收集
3.空间整合:与CMS的“标记-清理”算法不同,G1从整体来看是基于“标记-整理”算法实现的收集器,从局部来看是基于复制算法实现的。运行过程不会产生空间碎片,收集后能提供规整的可用内存。这种特性有利于程序长时间运行,分配大对象时不会因为无法找到连续的内存空间而提前触发下一次GC。
4.可预测的停顿
2.4 内存分配与回收策略
2.4.1 对象优先在Eden分配
大多数情况下,对象在新生代Eden区中分配,当Eden区没有足够空间进行分配时,虚拟机将发起一次Minor GC(指发生在新生带的垃圾回收动作,因为Java对象大多具备朝生夕灭的特性,所以Minor GC非常频繁,一般回收速度也快)。
2.4.2 大对象直接进入老年代
多位的大对象是指需要大量连续内存空间的Java对象,典型的大对象就是那种很长的字符串以及数组。
2.4.3 长期存活的对象将进入老年代
虚拟机给每个对象定义了一个对象年龄(Age)计数器。如果对象在Eden出生并经过第一次Minor GC收仍然存活,并且能被Survivor容纳的话,将移到Survivor空间,并且设置对象年龄为1.对象在Survivor中每“熬过”一次Minor GC,年龄就增加1岁,当年龄增加到一定程度(默认15岁),就会被晋升到老年代。
2.4.4 动态对象年龄判定
为了能更好地适应不同程序的内存状况,虚拟机并不是永远地要求对象的年龄必须达到MaxTenurningThreshold才能晋升老年代,如果在Survivor空间中相同年龄所有对象大小的总和大于Survivor空间的一半,年龄大于或等于该年龄的对象就可以直接进入老年代,无须等到MaxTenurningThreshold要求的年龄。
2.4.5 空间分配担保
在发生Minor GC之前,虚拟机会先检查老年代最大可用的连续空间是否大于新生代所有对象总空间,如果这个条件成立,那么Minor GC可以确保是安全的。如果不成立,则虚拟机会查看HandlePromotionFailure设置值是否允许担保失败。如果允许,那么会继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小,如果大于,将尝试着进行一次Minor GC,尽管这个Minor GC是有风险的;如果小于,或者HandlePromotionFailure设置不允许冒险,那这时也要改为进行一次Full GC。
补充:常用的调优参数
- -XX:SurvivorRatio:Eden和Survivor的比值,默认是8:1
- -XX:NewRatio:老年代和年轻带内存大小的比例
- -XX:MaxTenuringThreshold:对象从年轻带晋升到老年代经过GC次数的最大阈值