一、简介
JVM采用分代垃圾回收。JVM把堆空间分为年老代和年轻代。98%的对象创建了没多久就会消亡,存储在年轻代,而年老代中存放生命周期长久的实例对象。年轻代中又被分为Eden区(圣经中的伊甸园)、和两个Survivor区。新的对象分配是首先放在Eden区,Survivor区作为Eden区和Old区的缓冲,在Survivor区的对象经历若干次收集仍然存活的,就会被转移到年老区。
HotSpot JDK(1.6为例)将其物理堆上划分为两个空间:
– 新生代(young generation)和老年代(old generation)+ 方法区。
新生代(Young generation): 大部分对象在创建后会很快变得不可到达,所以很多对象被创建在新生代,然后消失。对象从这个区域消失的过程我们称之为”minor GC“。一般在此使用的GC算法是Copying(复制)算法。因为大部分对象马上消亡所以复制的成本很低又解决了标记-清除算法的碎片化问题。注意,Minor GC并不代表年轻代内存不足,它事实上只表示在Eden区上的GC。
老年代(Old generation): 对象没有变得不可达,并且从新生代中存活下来,经过几次后,会被拷贝到这里。其所占用的空间要比新生代多。也正由于其相对较大的空间,发生在老年代上的GC要比新生代少得多。对象从老年代中消失的过程,我们称之为“major GC”,一般采用Mark-Compact算法。、
上图中的持久代(permanent generation)也被称为方法区(method area)。他用来保存类常量以及字符串常量。因此,这个区域不是用来永久的存储那些从老年代存活下来的对象。这个区域也可能发生GC。并且发生在这个区域上的GC事件也会被算为major GC。
❓: 如果老年代的对象需要引用一个新生代的对象,会发生什么呢?
答:如果需要执行Minor GC,则可能需要查询整个老年代以确定是否可以清理回收,。所以老年代中存在一个"card table"的数据结构,是一个512bytes的数组,所有老年代对象引用新生代对象的记录都记录在这里。Young GC时,只要查这里即可,不用再去查全部老年代,因此性能大大提高。
二. 内存分配步骤
年轻代可以分为3个区域:Eden区和两个存活区(From 区 、To 区)。
1⃣️ :绝大多数刚创建的对象会被分配在Eden区,Eden区是连续的内存空间,因此在其上分配内存极快。
2⃣️ :当Eden区满的时候,执行Minor GC,将消亡的对象清理掉,并将存活的对象复制到一个存活区From区(此时,To区是空白的,两个Survivor区总有一个是空白的)。
3⃣️ :此后,在Eden区执行GC之后,存活的对象会被堆积在同一个Survivor空间。
4⃣️ :当一个Survivor空间饱和,还在存活的对象会被移动到另一个Survivor空间。之后会清空已经饱和的那个Survivor空间。
5⃣️ :在以上的步骤中重复几次依然存活的对象,就会被移动到老年代。当对象在Survivor区躲过一次GC的话,其对象年龄便会加1,默认情况下,如果对象年龄达到15岁,就会移动到老年代中。
一般来说,大对象会被直接分配到老年代,大对象是指需要大量连续存储空间的对象,最常见的一种大对象就是大数组,比如:
byte[] data = new byte[8*1024*1024]
这种一般会直接在老年代分配存储空间。
在Eden区,HotSpot虚拟机使用了两种技术来加快内存分配。分别是bump-the-pointer和TLAB(Thread-Local Allocation Buffers),具体请自行百度。
三. 空间分配担保
在发生Minor GC之前,jvm会检查年老代最大可用的连续空间是否大于新生代所有对象的总空间,如果成立,那么Minor GC是确保安全的。如果不成立,则jvm会查看HandlePromotionFailure的值是否允许担保,如果允许则继续检查老年代最大可用的连续空间是否大于历次晋升到老年代对象的平均大小。如果大于将尝试一次Minor GC,如果小于或者HandlePromotionFailure不允许“冒险”,则进行一次Major GC。大部分时候都打开HandlePromotionFailure防止频繁Major GC。
可能存在年老代对象引用新生代对象的情况,如果需要执行Young GC,则可能需要查询整个老年代以确定是否可以清理回收,这显然是低效的。解决的方法是,年老代中维护一个512 byte的块——”card table“,所有老年代对象引用新生代对象的记录都记录在这里。Young GC时,只要查这里即可,不用再去查全部老年代,因此性能大大提高。
步骤流程: