注:本文参考自《深入理解Java虚拟机:JVM高级特性与最佳实践》及其它优秀的博客,在此表示对这些作者们的感谢。
一、Java虚拟机运行时数据区
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。如下图:
1、栈
Java虚拟机栈是线程私有的(JVM为每个新创建的线程都分配一个栈),它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)用来存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用到执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表存储了编译期可知的各种基本类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型)。局部变量表所需的内存空间在编译期间完成确定,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小
2、堆
Java堆是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。所有的对象实例及数组都要在堆上分配。
Java堆是垃圾收集器管理的主要区域,也被称为GC堆。由于现在的垃圾收集器基本都采用分代收集算法,因此堆还可以细分为:新生代和老年代;再细分一点有Eden空间、From Survivor空间、To Survivor空间等。
Java堆可以处于物理上不连续的内存空间中,只要逻辑上连续即可。
3、方法区
存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
Class文件常量池:存储类的版本,字段,方法,接口等描述信息
运行时常量池:存放编译期生成的各种字面量和符号引用。
4、对象的创建
4.1 检查常量池完成类加载:虚拟机遇到一条new指令时,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并检查这个符号引用代表的类是否已经被加载、解析和初始化过。如果没有,那必须先执行相应类的加载过程。
4.2 在堆中为新生对象分配内存:对象所需要的大小在类加载完成后便可完全确定,为对象分配空间的任务等同于把一块确定大小的内存从Java堆中划分出来。
4.3 虚拟机将新分配的内存空间都初始化为零值(不包括对象头)
4.4 虚拟机对对象进行设置:虚拟机设置这个对象是哪个类的实例、如何才能找到类的元数据信息、对象的哈希码、对象的GC分代年龄等信息。
4.5 执行<init>方法,完成初始化
示例一:字符串创建
字符串对象的引用存储在栈中,编译期已创建好的(双引号定义的)则存储在常量池,运行时才new出来的则存储在堆中。对于equals相等的字符串,在常量池中只有一份,在堆中有多份。
下图中橙色的线:new一个字符串时,会先去常量池中检查是否存在此对象,如果没有则在常量区创建此字符串对象,再在堆中创建一个该对象的拷贝对象。因此,String s = new String("xyz"); 产生几个对象?一个或两个,如果常量池中原来没有"xyz",就是两个。
String s1 = "china";
String s2 = "china";
String s3 = "china";
String ss1 = new String("china");
String ss2 = new String("china");
String ss3 = new String("china");
示例二:变量和常量
变量和引用存储在栈中,常量存储在常量池中。局部变量是方法或语句块内块定义的变量(包括形式参数),存储在栈中,随着方法的消失而消失;成员变量是方法外部的变量,存储在堆中该对象里,由垃圾回收器负责回收。
栈中i1、i2、i3都指向9(出于压缩空间提高利用率的考虑),如果令i2=7,会在栈里生成7再令i2指向7。(区别于对象的引用:多个引用指向同一个对象,修改其中一个引用指向的对象,则其它引用指向的对象发生修改)
int i1 = 9;
int i2 = 9;
int i3 = 9;
public static final int INT1 = 9;
public static final int INT2 = 9;
public static final int INT3 = 9;
二、垃圾回收机制
1、对象已死?
1.1 引用计数法(JVM不用)
1.2 可达性分析算法
2、垃圾回收算法
2.1 标记-清除算法
标记-清除:首先标记出所有需要回收的对象,在标记完成后统一回收所有被标记的对象。
缺点:1、标记和清除两个阶段的效率都不够高; 2、标记清除后会产生大量的不连续内存碎片。
2.2 复制算法
复制算法:将可用内存划分为大小相等的两块,每次只使用其中的一块。当这一块的内存用完了,就将还存活着的复制到另外一块上面,然后再把已使用过的内存空间一次清理掉。
使用场景:这种垃圾收集算法常用于新生代。 IBM研究表明,新生代中的对象98%是“朝生夕死”的。HotSpot默认把内存区域分为一个Eden(80%)、两个Survivor(10%),每次使用Eden和Survivor其中的一块。
2.3 标记-整理算法
标记-整理算法:标记过程仍然与标记-清除算法一样,但后续步骤不是直接对可回收对象进行清理,而是让所有存活的对象都向一端移动,然后直接清理掉端边界以外的内存。
2.4 分代收集算法
分代收集算法:根据对象存活的时间不同把内存(Java堆)划分为新生代和老年代。
策略:在新生代中,每次垃圾收集时都发现有大批的对象死去,只有少量存活,选用复制算法,只需复制少量存活对象就可以完成收集;老年代中因为对象的存活率高、没有额外的空间对它进行担保,必须采用标记-清理算法或者标记整理算法。
3、垃圾回收器
3.1 Serial & Serial Old
3.2 Paraller Scavenge & Paraller Old
3.3 ParNew & CMS(G1)