虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型
java语言里面类的加载、连接和初始化都是在程序运行期间完成的
一、类加载的时机
类从被加载到虚拟机内存中开始,到卸载出内存为止,整个生命周期包括:加载、验证、准备、解析、初始化、使用、卸载几个步骤。
其中验证、准备、解析三个部分统称为连接。
加载、验证、准备、初始化、卸载这五个过程顺序是确定的,这五个过程必须按部就班的开始。但是解析的顺序不确定,有时候可以在初始化之后再开始,这是为了支持Java语言的运行时绑定。
那么什么情况下需要开始类加载的第一个步骤“加载”呢?Java虚拟机没有对这一步进行强制的要求,但是对初始化阶段,虚拟机规范则规定了有且只有五种情况必须立即开始进行初始化。
1、遇到new、getstatic、putstatic、invokestatic这四条字节码指令时,如果类没有进行初始化,则需要首先触发初始化。生成这四个字节码指令最常见的Java代码场景:使用new关键字实例化对象、读取或者设置一个类的静态变量(被final修饰、已在编译期把结果放入常量池的静态字段除外)、调用一个类的静态方法的时候。
2、使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有初始化,首先要先触发其初始化。
3、初始化一个类时,如果发现其父类还没有初始化,则先初始化其父类
4、虚拟机启动时,用户需要指定一个要执行的主类,虚拟机会先初始化这个主类
5、当使用java1.7动态语言支持时,如果一个java.lang.invoke.MethidHandle实例最后的解析结果REF_getStatic、REF_putStatic、REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有经过初始化,则需要先触发其进行初始化。
二、类加载的过程
1、加载
加载阶段,虚拟机需要完成三件事情
(1)通过一个类的全限定名来获取定义此类的二进制字节流
(2)将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构
(3)在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口。
2、验证
验证是连接阶段的第一步。是为了确保所加载的class文件的字节流包含的信息符合虚拟机的要求
验证阶段主要分为以下四个阶段的校验动作:文件格式验证、元数据验证、字节码验证、符号引用验证
(1)文件格式验证
第一阶段主要是验证字节流是否符合Class文件格式的规范,这个阶段的验证是基于二进制字节流进行校验的。通过这个阶段的验证,字节路才会进入内存的方法区中进行存储,后面三个阶段都是基于方法取的存储结构进行验证,不会再直接操作字节流。
(2)元数据验证
第二个阶段是对字节码描述的信息进行语义分析,以保证描述的信息符合Java语言规范
(3)字节码信息验证-最复杂的一个阶段
通过数据流和控制流分析,确定程序的语义是合法、符合逻辑的。对类的方法体做出校验,确保被校验类的方法在运行时不会做出危害虚拟机的行为
(4)符号引用验证
最后一个阶段是发生在虚拟机将符号引用转化为直接引用的时候,这个转化动作将在解析阶段发生。符号引用验证可以看做是对类自身以外(常量池中的各种符号引用)的信息进行匹配性检验,通常需要校验以下内容
a.符号引用中通过字符串描述的全限定名能否找得到对应的类
b.在指定类中是否存在符合方法的字段描述符以及简单名称所描述的方法和字段
c.符号引用中的类、字段、方法的访问性是否能被当前的类访问
3、准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段。这些变量所使用的内存都将在方法区中进行分配。这时候进行内存分配的变量仅仅包括类变量,不包括实例变量,实例变量将会在对象实例化时随对象一起分配到Java堆中。
4、解析
解析是虚拟机将常量池内的符号引用替换为直接引用的过程。
5、初始化
初始化是类加载的额最后一步。前面的类加载过程,除了在加载阶段用户应用程序可以通过自定义的类加载器参与之外,其余动作完全由虚拟机主导和控制。到了初始化阶段,才开始真正执行类中定义的Java程序代码。初始化阶段是根据程序员通过程序制定的主观计划去初始化类变量及其他资源,或者说初始化是执行类构造器<clinit>()方法的过程。
(1)<clinit>()方式是由编译器自动收集类中的所有类变量的赋值动作和静态语句块(static{})合并决定产生的,顺序是由语句在源文件出现的顺序决定的。
(2)<clinit>()方法与类的构造函数(或者说实例构造函数<init>()方法)不同,它不需要显式的调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行之前,父类的<clinit()>方法已经执行完毕。
(3)由于<clinit>()方法先执行,也意味着父类中定义的静态语句块要优于子类变量赋值操作。
(4)<clinit>()方法对于类或者接口来说不是必须的,如果一个类中没有static块或者没有对变量的赋值操作,那么编译器可以不为这个类生成<clinit>()方法
三、类加载器
类加载阶段中的通过类的全限定名来获取描述此类的二进制字节流这个动作放到java虚拟机之外进行实现,以便让应用程序自己去决定如何获取所需要的实现类,实现这个动作的代码模块称为类加载器
1、类与类加载器
类加载器除了在类加载阶段中通过类的全限定名来获取类的二进制流之外,还有另外一个重要的作用,就是对于任意一个类,都需要类本身和它的类加载器一起确立其在Java虚拟机中的唯一性。
换句话说:即使两个类来源于同一个Class文件,被同一个JVM加载,只要加载的类加载器不同,这两个类就必定不同。
2、双亲委派模型
Java虚拟机的类加载器可以分为以下三种:
(1)启动类加载器(Bootstrap ClassLoader) C++实现,是Java虚拟机的一部分。负责加载存放在<JAVA_HOME>\lib目录中,或者被-Xbootclasspath参数所指定的路径中的,并且是虚拟机识别的类库加载到虚拟机内存中。
(2)扩展类加载器(Extension ClassLoader) 由sun.misc.Launcher$ExtClassLoader实现,它负责加载<JAVA_HOME>\lib\ext目录中的,或者被java.ext.dirs系统变量所指定的路径中的左右类库。
(3)应用程序类加载器(Application ClassLoader)由sun.misc.Launcher$AppClassLoader实现,负责加载类路径上所指定的类库。
我们的应用都是由这3种类加载器相互配合加载的,如果有必要,还可以加入自己定义的类加载器。
类加载器的层析关系如下图,除了启动类加载器外,所有的类加载器都有一个父类加载器。这种层次关系叫做类加载器的双亲委派模型
双亲委派模型的工作流程:如果一个类加载器收到了加载类的请求,不会自己进行加载,而是把这个请求委托给自己的父类加载器进行加载,也就是说所有的类最终都会传递到启动类加载器中。如果父类加载器无法进行加载,才会尝试自己去加载。
为什么会有双亲委派模型呢?这样做有一个好处,Java类随着类加载器有一种带有优先级的层次关系。例如java.lang.Object,无论哪一个类要加载这个类,都要委托给启动类加载器,因此Object类在程序的各种类加载器环境中都是同一个类。如果不用双亲委派模型,用户自己编写了一个java.lang.Object的类,并放在程序的ClassPath中,系统将会出现多个不同的Object类。
参考文献:《深入理解Java虚拟机》周志明著