知识要点:
类加载机制简介
类加载机制流程
类加载机制简介
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这就是虚拟机的类加载机制。
类加载机制流程
类从被加载到虚拟机内存中开始,到卸载出内存为止,它的整个生命周期包括:加载(Loading)、验证(Verification)、准备(Preparation)、解析(Resolution)、初始化(Initialization)、使用(Using)和卸载(Unloading)7个阶段。其中准备、验证、解析3个部分统称为连接(Linking)
类加载的过程包括了加载、验证、准备、解析、初始化五个阶段。在这五个阶段中,加载、验证、准备和初始化这四个阶段发生的顺序是确定的,而解析阶段则不一定,它在某些情况下可以在初始化阶段之后开始,这是为了支持 Java 语言的运行时绑定(也成为动态绑定或晚期绑定)。另外注意这里的几个阶段是按顺序开始,而不是按顺序进行或完成,因为这些阶段通常都是互相交叉地混合进行的,通常在一个阶段执行的过程中调用或激活另一个阶段。
加载
加载是类加载过程的第一个阶段,在加载阶段,虚拟机需要完成以下三件事情:
①获取二进制字节流
②静态存储结构转化为方法区的运行时数据结构
③在Java堆里面生成一个类对象,作为方法区的访问入口。
Java二进制字节流可以获取的途径有:
- 从ZIP包中读取,JAR,WAR,EAR格式的基础
- 从网络中获取,Applet应用
- 运行时计算生成,动态代理技术
- 由其他文件生成,JSP应用,由JSP文件生成对应的Class类
验证
验证是连接阶段的第一步,确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。验证阶段大致分下面4个动作:
- 文件格式验证
- 元数据验证
- 字节码验证
- 符号引用验证
在验证过程中大致会抛出如下几种错误: - IncompatibleClassChangeError
- Unsupported major.minor version
- IllegalAccessError
- NoSuchFieldError
- NoSuchMethodError
文件格式验证
验证字节流是否符合Class文件格式的规范,并且能被当前版本的虚拟机处理。
- 验证Class文件的标识。魔数是否以0xCAFEBABE开头
- 验证Class文件的版本号。主次版本号是否在当前虚拟机处理范围之内
- 验证常量池。常量池的常量中是否有不被支持的常量类型
- 指向常量的各种索引值中是否有指向不存在的常量或不符合类型的常量
- CONSTANT_Utf8_info型的常量中是否有不符合UTF8编码的数据
- Class文件中各个部分及文件本身是否有被删除的或附加的其他信息
通过了这个阶段的验证后,字节流才会进入内存的方法区中进行存储。后面的验证会基于方法区的存储结构进行验证,而不再操作字节流进行验证。
元数据验证
该阶段主要对字节码描述的信息进行语义分析,以保证符合Java语言规范要求。
- 类是否有父类(除了java.lang.Object外,所有类都应当有父类)
- 类的父类是否继承了不允许被继承的类(final修饰的类)
- 如果类不是抽象类,是否实现了器父类或接口中要求实现的所有方法
- 类中的字段,方法是否与父类产生矛盾(如:覆盖了父类的final字段)
字节码验证
- 该阶段主要是通过数据流和控制流分析,确定程序语义是合法的。
- 对类的方法体进行校验分析,保证被校验类的方法在运行时不会做出危害虚拟机安全的事件。
符号引用验证
- 符号引用验证是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验,该阶段在虚拟机将符号引用转化为直接引用时发生。
- 符号引用中通过字符串描述的全限定名是否能找到对应的类。
- 在指定类中是否存在符合方法的字段描述以及简单名称所描述的方法和字段。
- 符号引用中的类,字段,方法的访问性(private,protected,public,default)是否可被当前类访问。
符号引用验证的目的就是确保解析动作能正常执行。
准备
准备阶段是为类变量分配内存并设置类变量初始化的阶段,这些变量所使用的内存当将在方法区中进行分
配。只对类变量进行内存分配(static修饰),不包括实例变量,实例变量将会在对象实例化是随着对象一起分配在Java堆中。
如:一个类变量的定义为
// n的初始化值是0,而不是2。因为这个时候还没执行任何初始化方法(<clinit>)。
public static int n = 2;
再例如:
// 编译时会为m生成ConstantValue属性,在准备阶段会根据ConstantValue将m值设置为2
public static final int m = 2;
类变量和实例变量
- 类变量:也称为静态变量,在类中以static关键字声明,但必须在方法构造方法和语句块之外
- 实例变量:属于该类的对象,必须产生该类对象,才能调用实例变量。
解析
解析的目的就是将常量池内的符号引用替换为直接引用。 - 符号引用(Symbolic References):符号引用以一组符号来描述所引用的目标,符号可以是任何形式的字面量,只要使用时能无歧义地定位到目标即可。符号引用与虚拟机实现的内存布局无关,引用的目标并不一定已经加载到内存中。符号引用的字面量形式已经明确定义在Java虚拟机规范的Class文件格式中。
- 直接引用(Direct References):直接引用可以是直接指向目标的指针,相对偏移量或是一个能间接定位到目标的句柄。直接引用与虚拟机实现的内存布局相关,同一个符号引用在不用虚拟机实例上翻译出来的直接引用一般不同。如果有了直接引用,那引用的目标必定已经在内存中存在。
一句话总结:符号引用是以字面量的形式明确定义在常量池中;直接引用是指向目标的指针,或者相对偏移量。
解析动作主要对类或者接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行,分别对应于常量池 - CONSTANT_Class_info
- CONSTANT_Fieldref_info
- CONSTANT_Methodref_info
- CONSTANT_InterfaceMethodref_info
- CONSTANT_MethodType_info
- CONSTANT_Methodref_info
- CONSTANT_MethodHandler_info
- CONSTANT_invokeDynamic_info
字段的解析
class A extends B implements C, D{
private String str; //字段的解析
}
解析字段的顺序:
①先查找本类A,如果包含了简单名称和字段描述符都与目标相匹配的字段,则返回这个字段的直接引用,查找结束。
②否则,在接口中查找。将会按照集成关系从下往上递归搜搜各个接口和它的父接口,如果接口中包含了简单名称和字段描述符都于目标相匹配的字段,则返回这个字段的直接引用,查找结束。
③否则,在父类中查找,如果在父类中包含了简单名称和字段描述符都于目标相匹配的字段,则返回这个字段的直接引用,查找结束
④否则,查找失败,抛出java.lang.NoSuchFieldError异常。
类方法的解析
class A extends B implements C, D{
private void inc(); //方法的解析
}
①如果在类方法表中发现class_index中索引的A是一个接口,哪就直接抛出java.lang.IncompatiableClassChangeError异常。
②如果通过了第一步,先查找本类A,是否由简单名称和描述符都于目标相匹配的方法,如果有则返回方法的直接引用,查找结束。
③否则,父亲中递归查找是否又简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束。
④否则,在类实现的接口列表及它们的父接口之中查找是否有简单名名称和描述符都与目标相匹配的方法,如果存在匹配的方法,说明类C是一个抽象类,这时查找结束,抛出java.lang.AbastractMethodError异常。
⑤否则,宣告方法查找失败,抛出java.lang.NoSuchMethodError。
接口方法的解析
与类的方法解析不同,如果在接口方法表中发现class_index中的索引A是个类而不是接口,那就直接抛出java.lang.IncompatiableClassError异常。
否则,先查找本接口,是否有简单名称和描述符都与目标匹配的方法,如果有则返回这个方法的直接引用,查找结束。
否则,在接口的父接口中递归查找,直到java.lang.Object类(查找范围包括Object类)为止,看是否有简单名称和描述符都与目标相匹配的方法,如果有则返回这个方法的直接引用,查找结束。
否则,宣告方法查找失败,抛出java.lang.NoSuchMethodError异常。
初始化
<clinit> 类的初始化。静态变量,静态块的初始化。所有的类变量初始化语句和类型的静态初始化器。
Java在编译之后会在字节码文件中生成<clinit>方法,称之为类构造器,类构造器同实例构造器一样,也会对静态语句块,静态变量进行初始化
<init> 对象的初始化
Java在编译之后会在字节码文件中生成<init>方法,称之为实例构造器。该实例构造器会对语句块,变量进行初始化,并调用父类的构造器。
<clinit>方法是在类加载过程中执行的,而<init>是在对象实例化执行的,所以<clinit>一定比<init>先执行。所以整个顺序就是:
- 父类静态变量初始化
- 父类静态语句块
- 子类静态变量初始化
- 子类静态语句块
- 父类变量初始化
- 父类语句块
- 父类构造函数
- 子类变量初始化
- 子类语句块
- 子类构造函数
**
后续将会持续为大家分享**