垃圾回收期与内存分配
可达性分析算法
在主流的商用程序语言的主流实现中,都是通过可达性分析来判定对象是否存活。这个算法的基本思路是通过一系列叫做“GC Roots”的对象作为起始点,从这些节点向下搜索。要是能够到达某个对象就说明该对象存活。要是不能,就说明该对象已经不可用,可以对其进行垃圾回收。
生存还是死亡
在可达性分析算法中判定为不可达的算法也不是立刻就会死亡,要真正宣告一个对象真正死亡,必须要经历两次标记过程。若是发现没有与GC Roots相连接的引用链,那它将会第一次被标记。并且会进行一次筛选,筛选的条件就是是否有必要执行finalize()方法,当前对象没有覆盖finalize()方法或者finalize()方法以及执行过一次了都会被认为没有必要。(任何一个对象的finalize都只会被系统调用一次)
如果被判定为有必要的话,那么这个对象将会被放置到一个叫F-Queue的队列当中,并且在稍后由虚拟机自动建立一个Finalize的低优先级线程去执行。这里的执行是指虚拟机会触发这个方法,但不代表会等待它结束。
垃圾回收算法
标记-清除算法:先标记处所有需要回收的方法,在标记完成之后统一回收,只是最基础的垃圾回收算法,主要的不足有两个:1.效率 因为标记和清除的效率都不高 2.空间碎片 标记-清除之后会造成许多不连续的内存空间(以后要使用时会很不方便,比如要创建一个大容量的数组)
复制算法:先将可用的内存划分为相同的两块,每次只用其中的一块,当要回收时就将还存活的对象复制到另一块空间。然后,直接清理使用的那一块空间(虚拟机使用这种方法来回收新生代,但是并不需要1:1,因为新生代中存活的对象不多,大多都死得很快。所以只需分配一块较大的Eden空间和两块较小的Survivor空间,Eden:Survivor = 8:1,当新生代中内存不足时,需要老生代提供内存担保)
标记-整理算法:标记的过程与标记-清除算法一致。但是后续步骤不一样了,它是把存活的对象移动到一端,需要清理的对象移动到另外一端,中间用一个指针标记。(在老生代中使用 )
HotSpot算法实现
当前主流的虚拟机都是使用准确式GC,所以当系统停顿下来之后,并不需要一个不漏的检查所有的执行上下文和全局的引用位置,虚拟机应当是有办法直接知道哪些地方存放着对象引用。在HotSpot的实现中,是使用了一种OopMap的数据结构来达到这个目的。
安全点
安全点(SafePoint):在OopMap的帮助下HotSpot可以快速准确的完成GC Roots枚举。但是一个很现实的问题就是要是我们为每一条指令都建立对应的OopMap那么僵耗费大量的空间,这样GC的成本会非常高。所以,HotSpot并没有这么干,它是指在特定的位置来记录了这些信息,这个位置被称为安全点,即程序并非在每一个地方都可以GC,只能在到达安全点时才能暂停。
对于SafePoint是如何让所有线程都跑到安全点在停下来的,有两种方案:
1. 抢占式中断:不需要线程执行的代码去主动配合,在GC发生时,主动中断所有线程,如果线程不在中断点上,就恢复线程,让它跑到安全点上。(现在已经没有虚拟机采用这种)
2.主动式中断:不直接对线程进行操作,而是简单的设置一个标志位,各个线程在执行时主动去轮询这个标志位,一旦发现是安全点,就主动中断
安全区域
使用SafePoint并没有完美的解决如何进入GC的问题,当程序执行时如果没有分配CPU时间,线程时无法响应中断,并走到安全点的。
安全区域是指在一段代码中,引用关系不会发生改变,在这个区域中的任意地方GC都是安全的。当线程执行到安全区域(Safe Region)时,首先标记自己进入安全区域。当然,在这段时间里JVM要发起GC时,就不用管标记自己为Safe Region的线程了。在线程要离开Safe Region时,它只需要检查是否已经完成根节点枚举如果完成,就离开。否则就必须等待,直到收到了可以安全离开的信号时。
垃圾收集器
如果说来及回收算法是理论的话,那么垃圾收集器就是理论的实现。
新生代收集器
Serial
Serial收集器是最基本,历史最悠久的一种收集器。在垃圾回收时,必须暂停所有正在工作的线程,直到它回收结束。
优点:简单高效,依然是JVM运行在Client模式下默认的新生代收集器。
ParNew
ParNew收集器其实就是Serial收集器的多线程版本。是Server模式下默认的新生代收集器,有一个很重要的原因是目前只有它能与CMS收集器配合工作
Parallel Scavenge
也是新生代的垃圾收集器,使用的复制算法。Parallel Scavenge收集器与同为新生代多线程收集器的ParNew相比,其特点是可以控制吞吐量(吞吐量=运行用户代码时间 / ( 运行用户代码时间 + GC时间))
老生代收集器
Serial Old
Serial收集器的老生代版本,使用的是标记整理算法
Parallel Old
Parallel Scavenge的老生代版本,使用的是标记-整理算法。是吞吐量优先的收集器,适用于注重吞吐量和CPU资源敏感的场合
CMS收集器
CMS收集器是一种以获取短回收停顿时间为目标的处理器,目前有很多Java应用集中在互联网网站或者B/S系统的服务器上,这类应用尤其重视服务的响应速度
CMS收集分为四个步骤:
1.初始标记
2.并发标记
3.重新标记
4.并发清除
其中,初始标记和重新标记两个步骤任然需要“Stop The World”。初始标记仅仅是标记一下GC Roots能直接关联到的对象,速度很快。并发标记阶段是进行GC Roots Tracing(追踪)。重新标记则是为了修正并发标记期间程序继续运作而导致标记变动的那一部分对象的标记记录
CMS有明显的三个缺点:
1.CMS对CPU资源特别敏感
2.无法处理浮动的垃圾(可能出现“Concurrent Mode Failure”,而导致另一次Full GC)
由于CMS并发清理阶段用户线程还在运行,这一部分的垃圾出现在标记过程之后,CMS无法再当次集中处理掉它们。这些垃圾就是浮动垃圾。
3.采用的是标记-清除算法,这个算法会导致大量内存空间不连续,而老生代正是需要大量连续空间的地方
G1收集器
与其他处理器相比,G1收集器有如下优点:
1.并行与并发:G1收集器能够充分利用多CPU,多核环境下的硬件优势,使用多个多个CPU来压缩Stop-The-World的时间
2.分代收集:与其他收集器一样,分代的概念在G1中依然存在
3.空间整合:与CMS的标记-清除算法不同,G1收集器在整体来是基于标记-整理算法,从局部来看是基于复制算法
4.可预测停顿:G1除了追求低停顿以外,还能够建立可预测的停顿时间模型。
在G1收集器中,虽然还有新生代与老生代的概念,但是它是将Java堆分层若干个Region,新生代和老生代不再是物理隔离的了。G1追踪各个Region里面垃圾堆积的价值大小,在后台维护一个优先列表,每次根据允许的收集时间,优先收集价值最大的Region。
内存分配策略
对象优先分配
对象优先在Eden分配,当Eden空间不够时会发生一次Minor GC
大对象直接进入老年代
大对象是指需要大量连续空间的Java对象,最典型的就是那种很长的字符串以及数组(比如byte数组)。大对象对于虚拟机的内存分配是一个坏消息,必须要大对象更加坏的消息就是遇到一群短命的大对象,经常出现的大对象容易导致内存还有不少空间时就提前触发垃圾收集来获取足够的连续空间。
动态年龄的判定
如果Survivor空间中相同年龄的所有对象的大小总和大于Survivor的一半,大于或等于该年龄的对象将直接进入老生代。