一、Class类文件的结构
任何一个Class文件都对应着唯一一个类或接口的定义信息,但是反过来不成立,类或接口并不一定都得定义在文件里(比如类或接口也可以动态生成,直接送入类加载器中)。
Class文件是一组以8个字节为基础单位的二进制流,各数据项按顺序紧凑的排列,中间没有添加任何分隔符,因此Class文件中存储的内容几乎全是程序运行的必要数据,没有空隙存在,当遇到需要占用8字节以上空间的数据项时,按照高位在前的方式分成若干8字节进行存储。
Class文件格式采用类似于C语言结构来存储数据,包含两种数据类型:
(1)无符号数:属于基本的数据类型。u1、u2、u8分别代表1个字节、2个字节、8个字节的无符号数,无符号数可以用来描述数字、索引引用、数量值或按照UTF-8编码构成的字符串值。
(2)表:表是有多个无符号数或者其他表作为数据项构成的复合数据类型,所有表的命名都习惯以“_info”结尾。整个Class文件本质上也可以看做一张表,由以下数据项按照严格顺序排列构成:
二、类生命周期
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验、转换解析和初始化,最终形成可以被虚拟机直接使用的Java类型,这个过程被称为虚拟机的类加载机制。一个类型从被加载到虚拟内存中开始,到卸载出内存为止,整个生命周期会经历七个阶段:
其中,加载、验证、准备、初始化、卸载这五个阶段的顺序是肯定的,类加载过程必须按照这种顺序进行。而解析则不一定,在某些情况下,解析可以再初始化阶段之后开始,即动态绑定或晚期绑定。
加载过程中的第一阶段,加载,由虚拟机自行把握时机开始。但对于“初始化”,有且只有以下六种情况必须立即对类进行“初始化”:
(1)遇到new、getstatic、putstatic、invokestatic字节码指令时,如果类型没有初始化,则需要触发初始化;
能够生成上述四条字节码指令的场景由:(1)使用new关键字实例化对象的时候 (2)读取或设置一个类型的静态字段时 (3)嗲用一个类型的静态方法时 。
(2)使用java.lang.reflect包的方法对类进行反射调用时,如果类没有进行过初始化,则需要先触发初始化;
(3)当初始化类的时候,如果发现父类还没有初始化,则需要先触发父类的初始化;
(4)当虚拟机启动时,需要指定一个主类(main()),虚拟机会先初始化这个主类;
(5)如果一个java.lang.invoke.MethodHandle实例最后解析结果为REF_getStatic、REF_putStatic、REF_invokeStatic、REF_newInvokeSpecial四种类型的方法句柄,并且句柄对应的类没有初始化过,则需要先触发初始化;
(6)当一个接口定义了默认方法(default关键字修饰的接口方法),如果该接口的实现类发生了初始化,则该接口要在其之前被初始化。
这六种场景,也称为对一个类型的主动引用。除此之外的所有引用都不会触发初始化,被称为被动引用。
三、类加载过程
虚拟机中,类加载过程分为:加载、验证、准备、解析、初始化五个阶段。
1. 加载
虚拟机在加载过程中,主要完成三件事:
(1)通过一个类的全限定名来获取定义此类的二进制字节流;
(2)将字节流代表的静态存储结构转化为方法区的运行时数据结构;
(3)在内存中生成一个代表该类的java.lang.Class对象,作为方法区该类的数据访问入口。
加载阶段结束后,虚拟机外部的二进制字节流就按照虚拟机设定的格式存储在方法区中,并在堆中实例化一个Class类的对象作为程序访问方法区的外部接口。
2. 验证
这一阶段是确保Class文件的字节流中包含的信息符合虚拟机规范的全部约束,确保这些信息不会危害虚拟机的安全。
加载过程中,并没有指明字节流的来源必须是Class文件,因此可以通过键盘输入等形式产生恶意的字节流文件,因此验证是必须的,如果不验证检查输入的字节流,很可能造成恶意字节码流导致的系统崩溃。
验证阶段主要包含这四个阶段的检验:文件格式检验、元数据检验、字节码检验、符号引用检验:
(1)文件格式检验:是否符合Class文件格式的规范;
(2)元数据检验:对字节码描述信息进行语义分析,比如检验当前类是否有父类、当前类的父类是否继承了不允许被继承的类等;
(3)字节码验证:通过数据流分析和控制流分析,检验程序语义的合法性和符合逻辑;
(4)符号引用验证:发生在虚拟机将符号引用转化为直接引用的时候,对类自身以外的各类信息进行匹配性校验,校验该类是否缺少或者被进制访问它依赖的某些外部类、方法、字段得资源,如果检验符号引用中通过字符串描述的全限定名是否能找到对应的类、符号引用中的类和字段能否被当前类访问等。
验证阶段是一个重要,但非必须的阶段,如果在测试环境反复执行且没有问题的项目,可以考虑在生产环境使用 -X verify:none 来设置关闭大部分的类验证,来缩短虚拟机类加载时间。
3. 准备
准备阶段是正式为类中定义的变量分配内存并设置初始值的阶段,这里的初始值通常情况是赋0值的阶段。该阶段进行内存分配的仅包含类变量,而不包含实例变量。
public static int a = 123 ;
在准备阶段过后,a的初始值为0,而不是123,因为此时尚未执行Java方法,而把a的值赋为123的指令时程序被编译后。
除了通常情况外,还有一类特殊情况:
publid static final int a = 123;
编译时Javac将会为a生成ConstantValue属性,在准备阶段直接根据ConstantValue将a的值设置为123。
4. 解析
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
符号引用:用一组符号来描述引用的目标,符号可以是任何形式的字面量,只有使用时能无歧义的定位到目标即可。符号引用的字面量形式明确定义在Class文件格式中。
直接引用:直接引用是可以指向目标的指针、相对偏移量或者是能间接定位到目标的句柄。
5. 初始化
直到最后一个阶段初始化,虚拟机才真正开始执行Java程序代码,将主导权交给应用程序。在准备阶段,变量已经赋过一次初始0值,而在初始化阶段,则会根据程序编码制定的主观计划去初始化类变量和其他资源。
四、类加载器
把类加载阶段“通过类的全限定名获取描述该类的二进制字节流”的动作放在虚拟机外部实现,以便让程序自己决定如何去获取所需的类,实现这个动作的代码被称为“类加载器”(Class Loader)。
对于每一个类,都需要由它的类加载器和这个类本身一起共同确立其在虚拟机中的唯一性,每一个类加载器,都拥有一个独立的类名称空间。
创建类加载器的语法结构为:
ClassLoader myClassLoader = new ClassLoader() {
@Overridepublic Class<?> loadClass(String name) throws ClassNotFoundException {
return ;
}
}
如果两个类由不同的类加载器加载,即便两个类来源于同一个Class文件,只要类加载器不同,这两个类必定不相等。示例代码:
运行结果: