阅读《深入理解Java虚拟机》(周志明著)第7章虚拟机类加载机制梳理与总结。
1.类加载时机
类从被加载到虚拟机内存中开始,到卸载出内存,生命周期包括如下图:
- 加载、验证、准备、初始化、卸载这五个阶段顺序是确定的
- 解析阶段某些情况下可在初始化之后,这是为了支持Java语言的运行时绑定(即动态绑定或晚期绑定)
- 这里的几个阶段是按顺序开始,而不是按顺序进行或完成,因为这些阶段通常都是互相交叉地混合进行的,通常在一个阶段执行的过程中调用或激活另一个阶段
Java中的绑定可参考:
http://blog.sina.com.cn/s/blog_62f28d560100uao1.html
2.类加载过程
2.1加载
加载阶段(Loading)是类加载(Class Loading)过程的一个阶段,注意混淆。
在加载阶段,虚拟机需要完成以下三件事情:
- 通过一个类的全限定名来获取其定义的二进制字节流。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
- 在Java堆中生成一个代表这个类的java.lang.Class对象,作为对方法区中这些数据的访问入口
相对于类加载的其他阶段而言,加载阶段(准确地说,是加载阶段获取类的二进制字节流的动作)是可控性最强的阶段,因为开发人员既可以使用系统提供的类加载器来完成加载,也可以自定义自己的类加载器来完成加载。(类加载器下文会介绍)
2.2验证
验证是连接阶段的第一步,目的是为了确保Class文件中的字节流包含的信息符合当前虚拟机的要求,而且不会危害虚拟机自身的安全(验证失败,抛出 java.lang.VerifyError 异常或子类异常)。
不同的虚拟机对类验证的实现可能会有所不同,但大致都会完成以下四个阶段的验证:文件格式的验证、元数据的验证、字节码验证和符号引用验证。
- 文件格式的验证
验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。
主要目的:是保证输入的字节流能正确地解析并存储于方法区之内,格式上符合描述一个Java类型信息的要求。
经过该阶段的验证后,字节流才会进入内存的方法区中进行存储,后面的三个验证都是基于方法区的存储结构进行的
- 元数据验证
主要目的:对类的元数据信息进行语义校验(其实就是对类中的各数据类型进行语法校验),保证不存在不符合Java语法规范的元数据信息。
- 字节码验证
该阶段验证的主要工作是进行数据流和控制流分析,对类的方法体进行校验分析,以保证被校验的类的方法在运行时不会做出危害虚拟机安全的行为。
- 符号引用验证
它发生在虚拟机将符号引用转化为直接引用的时候(解析阶段中发生该转化),主要是对类自身以外的信息(常量池中的各种符号引用)进行匹配性的校验。
2.3准备
准备阶段是正式为类变量分配内存并设置类变量初始值的阶段,这些内存都将在方法区中分配。
注意点:
- 这时候进行内存分配的仅包括类变量(static),而不包括实例变量,实例变量会在对象实例化时随着对象一块分配在Java堆中。
- 这里所设置的初始值通常情况下是数据类型默认的零值(如0、0L、null、false等),而不是被在Java代码中被显式地赋予的值。
2.4解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
- 符号引用
符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。
符号引用于虚拟机实现的内存布局无关,引用的目标不一样已经加载到内存中。
- 直接引用
直接引用可以是直接指向目标的指针、相对偏移量、一个能间接定位到目标的句柄。
直接引用于虚拟机实现的内存布局相关:同一个符号引用在不同虚拟机实例上翻译出来的直接饮用一般不会相同。若有了直接饮用,那引用的而目标必定已经在内存中存在。
解析动作主要针对类或接口、字段、类方法、接口方法四类符号引用进行,分别对应于常量池中的CONSTANT_Class_info、CONSTANT_Fieldref_info、CONSTANT_Methodref_info、
CONSTANT_InterfaceMethodref_info四种常量类型。
(解析动作也会针对:方法类型、方法句柄和调用点限定符,参考
https://baijiahao.baidu.com/s?id=1636309817155065432&wfr=spider&for=pc)
2.5初始化
是类加载过程的最后一步,该阶段真正开始执行类中定义的Java程序代码(字节码)。
另一角度看:初始化阶段是执行类构造器<clinit>()方法的过程。
触发类进行初始化的场景:
- 遇到new、getstatic、putstatic、invokestatic这4条字节码指令时若未初始化则触发。对应Java代码场景:new关键字实例化对象、读取或设置类的静态字段()、调用类的静态方法。
- 使用java.lang.reflect包的方法对类进行反射调用若未初始化则触发
- 初始化某子类,若父类未初始化则其父类也会被初始化
- 虚拟机启动时要执行的主类(包含main()方法的类)
<clinit>()方法执行中可能影响程序运行的特点和细节:
- <clinit>()方法是由编译器自动收集类中的所有类变量(静态成员变量)的赋值动作和静态程序块(static{})中的语句合并产生的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在其之后的变量,在前面的静态语句块中可以赋值,但是不能访问。
- <clinit>()方法与类的构造函数(或者说实例构造器<init>方法)不同,他不需要显式的调用父类构造器,虚拟机会保证在子类的<clinit>()方法执行前,父类的<clinit>()方法已经执行完毕。因此在虚拟机中第一个被执行的<clinit>()方法的类肯定是java.lang.object
- 由于父类的<clinit>()方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作。
- <clinit>()方法对于类或者接口来说,并不是必须的,如果一个类中没有静态语句块,也没有对类变量(静态成员变量)的赋值操作,那么编译器可以不为这个类生成<clinit>()方法。
- 接口中不能使用静态语句块,但仍然有变量初始化的赋值操作,因此接口与类一样都会生成<clinit>()方法。但接口与类不同的是,执行接口的<clinit>()方法不需要先执行父接口的<clinit>()方法。只有当父接口中定义的变量使用时,父接口才会初始化。另外接口的实现类在初始化的时候一样不会执行接口的<clinit>()方法。
- 虚拟机会保证一个类的<clinit>()方法在多线程情况下是安全的。可以被正确地加锁,同步,如果多线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()方法,其他线程都需要等待,直到活动线程执行完毕。如果一个类的<clinit>()方法中有耗时很长的操作,就可能造成多个线程阻塞,在实际应用中这种阻塞往往是很隐蔽的。
3.类加载器
3.1类加载器
Java程序系统提供的3种类加载器:
- 启动类加载器:Bootstrap ClassLoader,跟上面相同。它负责加载存放在JDK\jre\lib(JDK代表JDK的安装目录,下同)下,或被-Xbootclasspath参数指定的路径中的,并且能被虚拟机识别的类库(如rt.jar,所有的java.*开头的类均被Bootstrap ClassLoader加载)。启动类加载器是无法被Java程序直接引用的。
- 扩展类加载器:Extension ClassLoader,该加载器由sun.misc.Launcher$ExtClassLoader实现,它负责加载JDK\jre\lib\ext目录中,或者由java.ext.dirs系统变量指定的路径中的所有类库(如javax.*开头的类),开发者可以直接使用扩展类加载器。
- 应用程序类加载器:Application ClassLoader,该类加载器由sun.misc.Launcher$AppClassLoader来实现,它负责加载用户类路径(ClassPath)所指定的类,开发者可以直接使用该类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。
自定义类加载器。
3.2类加载器双亲委派模型
类加载器之间的层次关系,称为类加载器的双亲委派模型(Parent Delegation Model)。
双亲委派模型要求所有的类加载器都应当有自己父类加载器。它们之间的父子关系并不是通过继承(Inheritance)关系来实现的,而是使用组合(Composition)关系来复用父加载器的代码。
双亲委派模型模型在JDK1.2期间被引入并广泛应用于之后几乎所有的Java程序中,但它并不是一个强制性的约束模型,而是Java设计者们推荐给开发者的一种类的加载器实现方式。
双亲委派模型工作过程:如果一个类加载器收到了类加载的请求,它首先不会自己去尝试加载这个类,而是把请求委托给父加载器去完成,依次向上,因此,所有的类加载请求最终都应该被传递到顶层的启动类加载器中,只有当父加载器在它的搜索范围中没有找到所需的类时,即无法完成该加载,子加载器才会尝试自己去加载该类。
双亲委派模型优点:
- Java类随着它的类加载器(说白了,就是它所在的目录)一起具备了一种带有优先级的层次关系。例如,类java.lang.Object类存放在JDK\jre\lib下的rt.jar之中,因此无论是哪个类加载器要加载此类,最终都会委派给启动类加载器进行加载,这边保证了Object类在程序中的各种类加载器中都是同一个类。
- 保证Java程序的稳定运作,但实现非常简单(实现双亲委派模型的代码集中在java.lang.ClassLoader 的 loadClass() 方法中,下图展示jdk1.8源码)
欢迎大家讨论!!!