JVM运行时数据区:
- 虚拟机栈
虚拟机栈包含了局部变量表,操作数栈,动态链接,方法出口等。每个方法从执行到完成就是一个栈帧入栈到出栈的过程,出栈以后会返回一条字节指令的地址( returnAddress 类型,也就是回到方法刚开始执行的地方,程序计数器记录的位置)。局部变量表存放了基本数据类型,对象引用类型,returnAddress 类型。
当执行的方法过多,压入栈的深度超过了规定的最大深度则会出现 StackOverFlowError;当然现在大部分的虚拟机都是可以扩展栈深度,一旦扩展深度的时候分配不了内存了,就会出现 OutOfMemoryError。 - 本地方法栈
与虚拟机栈类似。不同点在于本地方法栈执行的是 native 方法,另外在执行本地方法栈的时候returnAddress则为null - 方法区
方法区存放着已被虚拟机加载的类信息,常量,静态变量以及即时编译后的代码 - 堆区
堆区主要分为新生代区和老年代区,新生代区又可以分为 Eden 区, From Survivor 区, To Survivor 区。主要存放对象实例 - 程序计数器
当前程序执行的行号指示器。指令进行分支,循环,跳转,异常处理,线程恢复都依赖程序计数器来完成。各个线程之间相互独立。
GC
Minor GC
当Eden区满的时候便会触发一次 Minor GC,清理的是新生代区的内存。原则上来说内存空间分配越快,GC的越频繁。Major GC
当老年代区满的时候便会触发一次 Major GC,清理的是老年代区的内存Full GC
清理所有区的内存
堆内存
Eden 区
伊甸园区,顾名思义就是对象"出生"的地方。一个对象在被创建之后就会被放入 Eden 区。survivor 区
幸存者区,survivor 区有两个。当发生一次 Minor GC 的时候,Eden 区和其中一个 survivor 区未被回收的对象将通过复制算法进入另外一个 survivor 区内,然后清除掉 Eden 区和前一个 survivor 区的对象。之后每发生一次 Minor GC ,survivor 区内的剩余的对象就会被复制到另外一个 survivor 区内,然后清理掉前一个 survivor 区的对象,这样可以保证其中一个 survivor 区是空的。每次发生 Minor GC ,剩余存活下来的对象计数会加1,知道计数达到上限的时候。old 区
老年代区。有两种情况会进入老年代区:一种是在 Minor GC 多次以后依然存活在 survivor 区的对象,当计数达到上限的时候会进入老年代区;另一种则是大对象(特别长的字符串或者是数组)在发生一次 Minor GC 时就会进入老年代区(主要是因为 survivor 区本身分配的内存不多)。而当发生 Major GC 时,老年代区的对象将会被回收。
判断对象是否需要被回收
- 引用计数法
给一个对象添加引用计数器,一旦被引用就会加1,一旦释放引用就减1。当计数为0时,代表当前对象没有被引用,那么可以被回收
优点:逻辑简单,操作简单
缺点:一旦两个对象被相互引用,那么当这两个对象都没有被使用的时候依然无法被回收。 - 可达性分析法
为了解决引用计数法的问题,于是就有了可达性分析法,根据 GC Roots 来判断是否需要被回收。
GC Root 可以分为四类- 虚拟机栈(栈帧中的本地变量表)中引用的对象;
- 方法区中类静态属性引用的对象;
- 方法区中常量引用的对象;
- 本地方法栈中 JNI(Native 方法)引用的对象。
当然通过可达性分析法判断对象GC Roots不可达的时候,虚拟机也不会立刻去回收对象。GC 时先判断该对象是否重写了 finalize 方法。
如果重写了 finalize 方法,将会将对象放置到一个F-Queue的队列中,然后由虚拟机自动创建一个低优先级的Finalizer线程去执行它,(注意此时对象是可以通过再次与 GC Root 相连接的方式让自己重新"复活")之后 GC 会再次判断该对象是否 GC Roots 可达,此时如果依然不可达,那么才会真正的进行回收
如果没有重写 finalize 方法,那么虚拟机就会直接回收该对象
如果之前已经执行过一次 finalize 方法,那么虚拟机就会直接回收该对象。换句话说,一个对象在完整 的生命周期中只可能会调用一次 finalize 方法
回收算法
-
标记-清除算法:
标记阶段:根据可达性分析法,标记出有被 GC Roots 引用的对象
清除阶段:遍历整个堆区,找出那边没有被标记的对象(说明这些对象已经没有被引用了),然后进行GC操作
复制算法:
将对应的区块分成两个部分,每次只使用其中一部分。当要进行回收的时候,将这一块存活的对象复制到另一块中,然后清空当前块的对象
- 标记-整理算法:
标记方式与1相同,不同点是标记完成后将标记的对象和未标记的对象分开,让标记对象和未标记对象各自处在一个连续的内存分配空间上。这样就不需要遍历整个堆区,只要直接对其中一整块进行操作即可
标记-清除算法:内存回收以后碎片化比较严重,之后无法存放大内存对象,会造成频繁 GC
复制算法:效率最高,但是由于要牺牲掉一部分内存,所以导致内存使用率不高
标记-整理算法:相较于标记-清除算法优势很明显,不会出现碎片化的内存区块,但是相应的 GC 效率也就比标记-清除算法低了
三种算法各有优缺点,因此绝大部分虚拟机都是采用的分代收集算法。
- 由于新生代区 GC 频率远远大于老年代区,所以必须得使用效率高的算法,标记-整理算法排除。另外新生代区 Eden 区,From survivor 区和 To survivor 区分配比例为 8:1:1,每次 GC 以后剩下的对象会进入空闲的 survivor 区中,使用复制算法也仅仅只会浪费 10% 的空间就可以提升效率,而且内存也会比较完整不会出现碎片化的情况。
- 老年代区 GC 频率低,而且老年代的对象本身存活率高。如果使用复制算法,将会浪费一部分空间,导致内存不足的情况发生。然后一旦发生 Minor GC ,剩余的对象进入老年代发现无法分配内存就会出现 OutOfMemoryError。因此这里会采用标记-清除算法或者标记-整理算法