JVM通过垃圾收集器(GC)进行垃圾回收。GC的工作主要分成两步:1.标记可清除对象。2.清除这些可清除对象。
标记可清除对象的方法
1.引用计数法:
每个对象都有一个引用计数器,当对象在某处被引用时,引用计数+1,引用消失,则引用计数-1。如果这个对象的引用计数为0,则表示这个对象没有被引用,则可标记为可清除对象。这种方式有一个缺点:如果两个对象相互引用,则这两个对象的引用计数都是1,此时即使这两个对象没有被其他对象引用,应该被清除,系统也不会标记他们为可回收的。
2.可达性分析法:
选定一些对象作为GC Roots,由这些GC Roots作为起点,开始以链的形式进行搜索标记(标记这些GC Roots的引用的对象,再标记这些对象引用的对象。。。)。这些被标记的对象被称为是可达的,那么没有被GC Roots连着的那些点则被标记为可以清除的。那么,可达对象是不是一定不会被清除呢?其实不一定,因为java中还有引用对象这个概念(如果是强引用,那么就不会被回收;如果是软引用,那么会在系统内存不足时被回收;如果是弱引用,那么下次GC回收时,就会被回收)。GC Roots的对象包括这些:
1.java栈中引用的对象
2.本地方法栈中JNI引用的对象
3.方法区运行时常量池引用的对象
4.方法区中静态属性引用的对象
5.运行中的线程
6.GC控制的对象
7.由引导类加载器加载的对象
垃圾回收算法
1.标记-清除算法:
标记-清除算法,即标记活动对象,未标记的为要清除的对象,并对这些对象进行回收。标记-清除算法有两个缺点:1.效率较低,因为标记和清除操作都比较耗时2.会产生不连续的内存碎片,对新对象的创建效率产生影响。
2.标记-压缩算法:
标记-压缩算法解决了产生不连续的内存碎片的问题。标记活动对象,之后活动对象向一端移动,直接清除这一端之外的所有内存空间。
3.复制算法:
复制算法将内存空间分成大小相同两部分,对象创建时只使用其中一部分,到了要回收时,复制活动对象到另一部分。然后将原来使用内存空间的那一部分清除。复制算法的标记和复制能同时进行,而且每次只对一块内存进行一次性回收,效率高,也没有内存碎片的问题。缺点就是一次性可分配的最大内存减少了一半。
4.分代收集算法:
针对不同对象的生命周期不同,使用不同的垃圾回收算法:
1.年轻代:
几乎所有新生成的对象首先都是放在年轻代的。新生代内存按照8:1:1的比例分为一个Eden区和两个Survivor(Survivor0,Survivor1)区。大部分对象在Eden区中生成。当新对象生成,Eden Space申请失败(因为空间不足等),则会发起一次GC(Scavenge GC)。回收时先将Eden区存活对象复制到一个Survivor0区,然后清空Eden区,当这个Survivor0区也存放满了时,则将Eden区和Survivor0区存活对象复制到另一个Survivor1区,然后清空Eden和这个Survivor0区,此时Survivor0区是空的,然后将Survivor0区和Survivor1区交换,即保持Survivor1区为空, 如此往复。当Survivor1区不足以存放 Eden和Survivor0的存活对象时,就将存活对象直接存放到老年代。当对象在Survivor区躲过一次GC的话,其对象年龄便会加1,默认情况下,如果对象年龄达到15岁,就会移动到老年代中。若是老年代也满了就会触发一次Full GC,也就是新生代、老年代都进行回收。
2.老年代:
在年轻代中经历了N次垃圾回收后仍然存活的对象,就会被放到年老代中。因此,可以认为年老代中存放的都是一些生命周期较长的对象。内存比新生代也大很多(大概比例是1:2),当老年代内存满时触发Major GC即Full GC,Full GC发生频率比较低,老年代对象存活时间比较长,存活率标记高。一般来说,大对象会被直接分配到老年代。
3.持久带:
用于存放静态文件(class类、方法)和常量等。持久代对垃圾回收没有显著影响,但是有些应用可能动态生成或者调用一些class