我们写的是.java文件,需要通过javac编译,产生.class文件,class文件才可以被JVM识别。我们经常见到的.jar文件,其实就是.class文件的压缩包(减少文件个数,方便操作),被加载到JVM才可以运行。
从上可以看出,JVM包含以下几个部分类加载、执行引擎、运行数据区以及垃圾回收器
。
运行数据区
运行时数据区区主要可以划分为5个区域
1 方法区(Method Area)
方法区包含两部分永久代(Permanent Generation)
用于存储类结构信息的地方,包括常量池、静态变量、构造函数、运行时常量池(Runtime Constant Pool)等和代码缓存
即编译后的代码(JIT)。虽然JVM规范把方法区描述为堆的一个逻辑部分, 但它却有个别名non-heap(非堆),所以大家不要搞混淆了。
永久代(持久代 Permanent Generation)—— -XX:MaxPermSize设置上限,-XX:PermSize设置最小值 例:VM Args:-XX:PermSize=10M -XX:MaxPermSize=10M。如果它的空间用完了,会导致java.lang.OutOfMemoryError: PermGen space的异常。
JAVA8开始,持久代已经被彻底删除了,取代它的是另一个内存区域也被称为元空间
。是本地堆内存中的一部分,它可以通过-XX:MetaspaceSize和-XX:MaxMetaspaceSize来进行调整,当到达XX:MetaspaceSize所指定的阈值后会开始进行清理该区域,如果本地空间的内存用尽了会收到java.lang.OutOfMemoryError: Metadata space的错误信息。
代码缓存(Code Cache)——这个缓存区域是用来存储编译后的代码。编译后的代码就是本地代码(硬件相关的),它是由JIT(Just In Time)编译器生成的,这个编译器是Oracle HotSpot JVM所特有的。
2 java堆(Heap)
存储java实例或者对象的地方。这块是GC的主要区域。堆的大小可以通过JVM选项-Xms和-Xmx来进行调整,当堆耗尽的时候,JVM会抛出java.lang.OutOfMemoryError 异常。从存储的内容我们可以很容易知道,方法区和堆是被所有java线程共享的。
堆被分为:
- Eden区 —— 新对象或者生命周期很短的对象会存储在这个区域中,这个区的大小可以通过-XX:NewSize和-XX:MaxNewSize参数来调整。新生代GC(垃圾回收器)会清理这一区域。
- Survivor区 —— 那些历经了Eden区的垃圾回收仍能存活下来的依旧存在引用的对象会待在这个区域。这个区的大小可以由JVM参数-XX:SurvivorRatio来进行调节。
- 老年代 —— 那些在历经了Eden区和Survivor区的多次GC后仍然存活下来的对象(当然了,是拜那些挥之不去的引用所赐)会存储在这个区里。这个区会由一个特殊的垃圾回收器来负责。老年代中的对象的回收是由老年代的GC(major GC)来进行的。
3 java栈(Stack)
java栈总是和线程关联在一起,每当创建一个线程时,JVM就会为这个线程创建一个对应的java栈。在这个java栈中又会包含多个栈帧,每运行一个方法就创建一个栈帧,用于存储局部变量表、操作栈、方法返回值等。每一个方法从调用直至执行完成的过程,就对应一个栈帧在java栈中入栈到出栈的过程。所以java栈是线程私有的。
4 程序计数器(PC Register)
用于保存当前线程执行的内存地址。由于JVM程序是多线程执行的(线程轮流切换),所以为了保证线程切换回来后,还能恢复到原先状态,就需要一个独立的计数器,记录之前中断的地方,可见程序计数器也是线程私有的。
5 本地方法栈(Native Method Stack)
和java栈的作用差不多,只不过是为JVM使用到的native方法服务的。本地方法栈的参数顺序、返回值和典型的 C 程序相同。
6 本地方法接口
主要是调用C或C++实现的本地方法及返回结果。
7 直接内存
直接内存并不是虚拟机运行时数据区的一部分。
在NIO中,引入了一种基于通道和缓冲区的I/O方式,它可以使用native函数直接分配堆外内存,然后通过一个存储在java堆中的DirectByteBuffer对象作为这块内存的引用进行操作。-XX:MaxDirectMemorySize设置最大值,默认与java堆最大值一样。
类加载
JVM将类加载分为3个步骤:
- 装载(Load)
- 链接(Link)
- 初始化(Initialize)
其中 链接(Link)又分3个步骤,如下图所示:
加载(Load)
查找并加载类的二进制数据(查找和导入Class文件)
加载是类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:
1)通过一个类的全限定名来获取其定义的二进制字节流。
2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
3)在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口。
相对于类加载的其他阶段而言,加载阶段(准确地说,是加载阶段获取类的二进制字节流的动作)是可控性最强的阶段,因为开发人员既可以使用系统提供的类加载器来完成加载,也可以自定义自己的类加载器来完成加载。
加载阶段完成后,虚拟机外部的 二进制字节流就按照虚拟机所需的格式存储在方法区之中,而且在Java堆中也创建一个java.lang.Class类的对象,这样向Java程序员提供了访问方法区内的数据结构的接口。
那么class文件加载又有什么原则呢?需要满足双亲委托原则,通过类加载器进行加载,类加载器分为以下几种:
[图片上传失败...(image-7e04f1-1515253471822)]
- Bootstrap ClassLoader 负责加载$JAVA_HOME中 jre/lib/rt.jar 里所有的class或Xbootclassoath选项指定的jar包。由C++实现,不是ClassLoader子类。
- Extension ClassLoader 负责加载java平台中扩展功能的一些jar包,包括$JAVA_HOME中jre/lib/*.jar 或 -Djava.ext.dirs指定目录下的jar包。
- App ClassLoader 负责加载classpath中指定的jar包及 Djava.class.path 所指定目录下的类和jar包。
- Custom ClassLoader 通过java.lang.ClassLoader的子类自定义加载class,属于应用程序根据自身需要自定义的ClassLoader,如tomcat、jboss都会根据j2ee规范自行实现ClassLoader。
加载过程中会先检查类是否被已加载,检查顺序是自底向上,从Custom ClassLoader到BootStrap ClassLoader逐层检查,只要某个classloader已加载,就视为已加载此类,保证此类所有ClassLoader加载一次。而加载的顺序是自顶向下,也就是由上层来逐层尝试加载此类。
链接(分3个步骤)
1)验证:确保被加载的类的正确性
验证是连接阶段的第一步,这一阶段的目的是为了确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致会完成4个阶段的检验动作:
文件格式验证:验证字节流是否符合Class文件格式的规范;例如:是否以0xCAFEBABE开头、主次版本号是否在当前虚拟机的处理范围之内、常量池中的常量是否有不被支持的类型。
元数据验证:对字节码描述的信息进行语义分析(注意:对比javac编译阶段的语义分析),以保证其描述的信息符合Java语言规范的要求;例如:这个类是否有父类,除了java.lang.Object之外。
字节码验证:通过数据流和控制流分析,确定程序语义是合法的、符合逻辑的。
符号引用验证:确保解析动作能正确执行。
验证阶段是非常重要的,但不是必须的,它对程序运行期没有影响,如果所引用的类经过反复验证,那么可以考虑采用-Xverifynone参数来关闭大部分的类验证措施,以缩短虚拟机类加载的时间。
2)准备:为类的静态变量分配内存,并将其初始化为默认值
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。对于该阶段有以下几点需要注意:
- 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。
- 这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值。
假设一个类变量的定义为:public static int value = 3; 那么变量value在准备阶段过后的初始值为0,而不是3,因为这时候尚未开始执行任何Java方法,而把value赋值为3的putstatic指令是在程序编译后,存放于类构造器<clinit>()方法之中的,所以把value赋值为3的动作将在初始化阶段才会执行。
3)解析:把类中的符号引用转换为直接引用
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程,解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用限定符7类符号引用进行。符号引用就是一组符号来描述目标,可以是任何字面量。
直接引用就是直接指向目标的指针、相对偏移量或一个间接定位到目标的句柄。
初始化
对类的静态变量,静态代码块执行初始化操作
初始化为类的静态变量赋予正确的初始值,JVM负责对类进行初始化,主要对类变量进行初始化。在Java中对类变量进行初始值设定有两种方式:
①声明类变量是指定初始值。
②使用静态代码块为类变量指定初始值。
类什么时候才被初始化呢?
1)创建类的实例,也就是new一个对象
2)访问某个类或接口的静态变量,或者对该静态变量赋值
3)调用类的静态方法
4)反射(Class.forName("com.lyj.load"))
5)初始化一个类的子类(会首先初始化子类的父类)
6)JVM启动时标明的启动类,即文件名和类名相同的那个类
只有这6中情况才会导致类的类的初始化。
类的初始化步骤 / JVM初始化步骤:
1)如果这个类还没有被加载和链接,那先进行加载和链接
2)假如这个类存在直接父类,并且这个类还没有被初始化(注意:在一个类加载器中,类只能初始化一次),那就初始化直接的父类(不适用于接口)
3 ) 假如类中存在初始化语句(如static变量和static块),那就依次执行这些初始化语句。
结束生命周期
在如下几种情况下,Java虚拟机将结束生命周期
1、执行了System.exit()方法
2、程序正常执行结束
3、程序在执行过程中遇到了异常或错误而异常终止
4、由于操作系统出现错误而导致Java虚拟机进程终止
参考
Java 类加载机制详解
深入理解Java类加载器(ClassLoader)
Java类加载机制
JVM内幕:Java虚拟机详解
JVM结构、GC工作机制详解