这节课主要讲了Class对象在执行是被加载的过程。这个过程分为三个步骤,分别为 装载 、链接 、初始化。而其中的链接又可以分为 验证 、准备 、解析三小步。
装载
装载是指Java虚拟机查找.class文件并生成字节流,然后根据自截留创建java.lang.Class对象的过程。
这一过程主要完成以下三件事:
ClassLoader 通过一个类的全限定名(包名 + 类名)来查找 .class 文件,并生成二进制字节流:其中 class 字节码文件的来源不一定是 .class 文件,也可以是 jar 包、zip 包,甚至是来源于网络的字节流。
把 .class 文件的各个部分分别解析(parse)为 JVM 内部特定的数据结构,并存储在方法区。
在内存中创建一个 java.lang.Class 类型的对象:
接下来程序在运行过程中所有对该类的访问都通过这个类对象,也就是这个 Class 类型的类对象是提供给外界访问该类的接口。
简单概括就是生成字节流,解析类所有信息并放在方法区,最后设置个类对象提供引用。
加载时机
当程序运行时,JVM 并不会一次性的将这些 .class 文件全部加载到内存中。那 JVM 是什么时候加载某 .class 文件呢?对此,Java 虚拟机规范中并没有严格规定,不同的虚拟机实现会有不同实现。不过以下两种情况一般会对 class 进行装载操作。
隐式装载:在程序运行过程中,当碰到通过 new 等方式生成对象时,系统会隐式调用 ClassLoader 去装载对应的 class 到内存中;
显示装载:在编写源代码时,主动调用 Class.forName() 等方法也会进行 class 装载操作,这种方式通常称为显示装载。
链接
链接过程分为 3 步:验证、准备、解析。
验证
验证是链接的第一步,目的是为了确保 .class 文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危及虚拟机本身的安全。主要包含以下几个方面的检验。
文件格式检验:检验字节流是否符合 class 文件格式的规范,并且能被当前版本的虚拟机处理。
元数据检验:对字节码描述的信息进行语义分析,以保证其描述的内容符合 Java 语言规范的要求。
字节码检验:通过数据流和控制流分析,确定程序语义是合法、符合逻辑的。
符号引用检验:符号引用检验可以看作是对类自身以外(常量池中的各种符号引用)的信息进行匹配性校验。
准备
准备是链接的第 2 步,这一阶段的主要目的是为类中的静态变量分配内存,并为其设置“0值”。比如:
public static int value = 100;
在准备阶段,JVM 会为 value 分配内存,并将其设置为 0。而真正的值 100 是在初始化阶段设置。并且此阶段进行内存分配的仅包括类变量,而不包括实例变量(实例变量将会在对象实例化时随着对象一起分配在 Java 堆中)。
有一种情况比较特殊--静态常量,比如:
public static final int value = 100;
以上代码会在准备阶段就为 value 分配内存,并设置为 100。
解析
解析是链接的最后一步,这一阶段的任务是把常量池中的符号引用转换为直接引用,也就是具体的内存地址。在这一阶段,JVM 会将常量池中的类、接口名、字段名、方法名等转换为具体的内存地址。
比如上面 Foo.java 中编译之后 main 方法的字节码如下:
在 main 方法中通过 invokevirtual 指令调用了 print 方法,“Foo.print:()V"就是一个符号引用,当
main 方法执行到此处时,会将符号引用“Foo.print:()V”解析(resolve)成直接引用,可以将直接引用理解为方法真正的内存地址。
初始化
这是 class 加载的最后一步,这一阶段是执行类构造器<clinit>方法的过程,并真正初始化类变量。
public static int value = 100;
在准备阶段 value 被分配内存并设置为 0,在初始化阶段 value 就会被设置为 100。
初始化的时机
对于装载阶段,JVM 并没有规范何时具体执行。但是对于初始化,JVM 规范中严格规定了 class 初始化的时机,主要有以下几种情况会触发 class 的初始化:
虚拟机启动时,初始化包含 main 方法的主类;
遇到 new 指令创建对象实例时,如果目标对象类没有被初始化则进行初始化操作;
当遇到访问静态方法或者静态字段的指令时,如果目标对象类没有被初始化则进行初始化操作;
子类的初始化过程如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化;
使用反射 API 进行反射调用时,如果类没有进行过初始化则需要先触发其初始化;
第一次调用 java.lang.invoke.MethodHandle 实例时,需要初始化 MethodHandle 指向方法所在的类。 (MethodHandle 方法句柄,可以看作反射)
初始化类变量
在初始化阶段,只会初始化与类相关的静态赋值语句和静态语句,也就是有 static 关键字修饰的信息,而没有 static 修饰的语句块在实例化对象的时候才会执行。
被动引用
上述的 6 种情况在 JVM 中被称为主动引用,除此 6 种情况之外所有引用类的方式都被称为被动引用。被动引用并不会触发 class 的初始化。
最典型的就是在子类中调用父类的静态变量,比如有以下两个类:
可以看出 Child 继承自 Parent 类,如果直接使用 Child 来访问 Parent 中的 value 值,则不会初始化 Child 类,比如如下代码:
执行上述代码,打印如下效果:
可以看出,Child 中的静态代码块并没有被执行。也就是说 JVM 并没有对 Child 执行初始化操作。
对于静态字段,只有直接定义这个字段的类才会被初始化,因此通过子类 Child 来引用父类 Parent 中定义的静态字段,只会触发父类 Parent 的初始化而不会触发子类 Child 的初始化。至于是否要触发子类的加载和验证,在虚拟机规范中并未明确规定,可以通过 XX:+TraceClassLoading 参数来查看,比如使用如下命令再次执行 NonInitTest:
java -XX:+TraceClassLoading NonInitTest
查看部分打印日志如下:
可以看出,虽然只有 Parent 被初始化,但是 Parent 和 Child 都经过了装载和验证阶段,并被加载到内存中。
class 初始化和对象的创建顺序
关于 class 的初始化还有一点经常会在面试中被提及,那就是对象的初始化顺序。当我们在代码中使用 new 创建一个类的实例对象时,类中的静态代码块、非静态代码块、构造函数之间的执行顺序是怎样的。
比如以下代码:
在 main 方法中执行了 2 次 new Child() 的操作,执行上述代码结果如下:
总结一下对象的初始化顺序如下:
静态变量/静态代码块 -> 普通代码块 -> 构造函数
父类静态变量和静态代码块;
子类静态变量和静态代码块;
父类普通成员变量和普通代码块;
父类的构造函数;
子类普通成员变量和普通代码块;
子类的构造函数。
至此,这就是这节课所有内容。