jvm中的gc大多数说的是对堆的资源回收,那么这些资源是如何回收的呢,下面是深入java虚拟机的学习笔记。
了解GC和内存分配的意义: 当出现内存溢出或泄露时,能够排查问题。当GC成为性能的瓶颈时,可以对jvm实施监控和优化。
问题:
1、哪些内存需要回收?
2、什么时候回收?
3、 如何回收?
哪些内存需要回收?
对象死了之后需要回收是毋庸置疑的,那么,什么样的对象是死的呢?
1、引用计算算法
给对象添加一个引用计数器,有地方引用他时,引用加一,引用失效时减一,引用为零时判定对象已死。
优点:简单明了,效率快。
缺点: 当对象间互相引用时,无法判定为对象死了。
2、可达性分析算法
当某个对象从‘GC Roots’无法到达时,判定为对象已死。‘GC Roots’不仅仅是一个,很多对象都可以当做‘GC Roots’,只要有一个Root可达,对象都不算死亡。
优点: 判断更为准确。
缺点: 需要对所有根节点进行可达性分析,效率更低(当然,这不是重要的缺点)。需要枚举出所有的根节点,这时候需要停止所有线程来获取较准确的根节点。
'GC Roots'是一系列的根节点,主要有下面四种:
1、虚拟机栈中的栈帧变量引用的对象
2、方法区中的静态属性引用的对象
3、方法区中常量引用的对象
4、本地方法(native)引用的对象
总结:大多是GC用的都是第二种算法,但是其实对象在判定死亡后不会立马被回收,需要经过两次标记,第一次需要判断是否死亡,然后被标记为可回收,第二次判断是否死亡时,才会真正的回收。在这期间如果被引用了,该对象会复活。
什么时候回收?
为了不损耗系统的资源,一般情况下都是在内存不足的情况下进行GC,当Eden区不足以放下新对象的话,会执行Minor GC,如果老年代不足以放下升入老年代的对象时,发生Full GC ,但Full GC是非常损耗性能的,应尽量避免。 (新生代中对象的年龄一般是按照经过Minor GC 的次数来的,一次加一岁,默认十五岁进入老年代)
如何回收?
如何回收的话就不追究各种GC的实现了,只谈谈常用的GC算法。
1、标记-清除
标记-清除算法,就是将可回收的资源进行标记,在空闲时回收这些资源。
如图,可以看到回收后内存空间已经变成一小块一小块的了,但大一点的对象来的时候并找不到对应的内存,不得不再次进行GC。
缺点: 内存不连续,无法很好的利用资源,很大可能性会造成不必要的GC。
2、复制
复制算法,将内存区域分为两部分,一次只使用一部分,对可回收资源进行标记,然后将存活对象复制到另一部分内存区域,再清空可回收资源部分的区域,实现内存连续。
缺点: 内存被分为了两部分,代价太高。
优化:研究表明,98%的新生代对象都可回收,所以将新生代分为一个Eden区和两个survivor区,默认采用8:1的内存分配,及Eden区为80%新生代内存,两个survivor区各占10%内存。每次创建对象都是在Eden区,执行一次Minor GC 都将存活对象复制到一个survivor区,即下次Eden区和该survivor区的存活对象复制到另一个survivor区。当然,很有可能有偶然情况,survivor区不足以存放存活对象,这时候由老年代来存放。
3、标记-整理
标记-整理算法,将可回收资源进行标记,将存活对象向一方移动,然后在空闲时清理边界以外的内存空间。
如图所示,整理出来的内存有很大的连续空间。
缺点: 整理是需要损耗资源的。
4、分代收集
分代收集算法,只是说之前的几种算法都各有优缺点,可以将jvm堆区域进行分代GC,可以提高性能。
整个堆区域分为新生代和老年代。由于大多数的垃圾收集器在新生代用的都是复制算法,故暂且将新生代分为Eden区和survivor区。
前面的复制算法中的优化,仅仅只是新生代可使用,因为新生代中如果无法分配内存,有老年代担着,而老年代如果无法分配内存,将没有其他地方可以放下对象了。
不同的垃圾收集器在老年代用的算法也有些不同,这需要自己去看书了。