前言
Class文件结构已经学习完毕,今天来学习下虚拟机如何加载Class文件。
C语音编译连接后直接就生成了可执行文件,程序执行,并不需要额外操作。但Java不一样,类型的加载和连接都是在程序运行期间完成的。
这会导致额外的开销,但这也给Java带来了无比的灵活性,比如动态加载技术正是基于此特性完成的。
本文主要主要内容如下:
- 类加载时机
- 类加载过程
- 类加载器
类加载时机
类从被加载到虚拟机内存开始,到卸载出内存为止,一共会经历 加载、验证、准备、解析、初始化、使用、卸载 7个阶段。其中 验证、准备、解析 这三个解析被称为连接过程。
一般来说,以上过程会按部就班地开始,但只是开始,因为这些阶段会交叉进行,通常会在一个阶段开始后激活调用另一个过程。
以下4种情况下,一定会开始类的加载过程:
遇到new、getstatic、putstatic、invokestatic等字节码指令时,而类没有经过初始化。生成这4个指令的常见情况:使用new关键字实例化对象、读取或设置类的静态字段(使用final关键字修饰除外)、调用类的静态方法
使用java.lang.reflect进行反射调用,而类没有经过初始化。
当初始化一个类时,发现其父类还没有被初始化,则需要先初始化其父类
当虚拟机启动时,用户需要指定一个主类(包含main方法),虚拟机会初始化这个主类。
回顾第1条,为啥final关键字修饰的静态成员变量会例外呢?回顾Class文件结构常量池知识,如果是final关键字修饰的static变量,它的值使用ConstantValue进行初始化,非final修饰的static变量在 clinit 方法中初始化。
以上4种场景被虚拟机称为有且只有的会触发类初始化的场景,这4种场景被称为对类的主动引用。除此之外的所有场景都不会触发类的初始化,被称为被动引用。
public class SuperClass {
/*
* 被动引用父类静态变量,不会初始化子类
*/
static{
System.out.println("super class init");
}
public static int value = 123;
}
public class SubClass extends SuperClass{
static{
System.out.println("sub class init");
}
}
public class ConstClass {
static{
System.out.println("const class init");
}
public static final String HELLO = "hello world";
}
/*
* 被动引用父类静态变量,不会初始化子类
*/
public static void invokeSuperStatic(){
System.out.println(SubClass.value);
}
/*
* 通过数组定义来引用类,不会触发类的初始化
*/
public static void accessByArray(){
SuperClass[] array = new SuperClass[10];
}
/*
* 访问final static变量,不会初始化类
*/
public static void accessFinalField(){
System.out.println(ConstClass.HELLO);
}
如上代码,一共对应了3种被动引用方式。
- 引用父类的静态变量,不会初始化子类
- 通过数组定义来引用类,不会触发类的初始化。此时没有初始化 SuperClass 类,但初始化了 [Lcom.okunu.jvm.init 这个类,它由字节码指令newarray触发,且实现了数组的 length 等方法。数组也是对象,是Java自动生成的对象,所以它并不会去初始化数组中的元素类。
- static final类型的常量,在编译阶段已把此常量存储到了NotInit类的常量池了,对常量 HELLO 的引用已经转化对自身常量池的引用了,所以不会初始化ConstClass类了
类加载过程
类加载过程分为 加载、验证、准备、解析、初始化、使用、卸载 7个阶段,本文中主讲前面5个阶段
1、加载
加载阶段主要做以下事情:
- 通过类的全限定名获取类的二进制文件流
- 将字节流所代表的静态存储结构转变为方法区的运行时数据结构
- 在堆中生成此类的 java.lang.Class 对象,作为方法区这些数据的访问入口
加载阶段是开发可控性最强的阶段,比如说开发可以使用自定义类加载器去加载某个类,类的来源也可以是jar包、class文件、甚至是网络流。
2、验证
验证是连接过程的第1步,它是为了确保Class文件的字节流符合虚拟机的规范。
加载阶段加载Class文件,并未规定Class文件的来源,如果愿意,甚至可以手动编写Class文件,但这样的Class文件有可能不符合虚拟机规范,所以需要验证。它主要进行如下方面验证:
- 文件格式验证
- 元数据验证
- 字节码验证
- 符号引用验证
3、准备
准备阶段是为类变量正式分配内存并赋默认值的阶段,这些内存都在方法区内分配。
有两个点需要强调:
- 只为类变量分配内存,即是为static变量分配内存,一般成员变量是在类被实例化时分配内存
- 只会为static变量赋默认值
假设有如下static变量
public static int value = 123
那么准备阶段,value的值会变成0,而不是123。而把value赋值为123的putstatic指令是在程序被编译后,存放在 clinit 方法中,所以value被赋值为123 发生在 初始化 阶段,即第5个阶段。
如果是final修饰的static变量呢?如果字段的字段属性表中存在ConstantValue属性,那么准备阶段,变量就会被初始化为ConstantValue存储的值。
假设上述变量为
public static final int value = 123
编译时javac会为value生成ConstantValue属性,准备阶段value的值就会成为123。
4、解析
解析阶段是将常量池中的符号引用替换为直接引用的过程。
符号引用是指字面量,能无歧义地定位到目标就好,它与虚拟机的内存布局无关。
直接引用,是指可以直接访问到对象的指针或句柄,与内存布局相关的。
解析主要针对类或接口、字段、类方法、接口方法4类符号引用。
5、初始化
初始化是类加载过程的最后一步,除了加载过程,开发可以使用自定义类加载器参与外,其它过程全都是虚拟机自己控制着。初始化阶段,才真正开始执行Java程序代码。
准备阶段,为static变量分配内存并赋默认值,而初始化阶段则会执行clinit方法,为static变量分配代码中所指定的值。
<clinit>方法是虚拟机自动生成的,编译器收集类中类变量的赋值语句、static静态语句块合并产生<clinit>方法。收集的顺序是代码顺序
<clinit>方法和 init 方法不同,它不需要显示调用父类<clinit>方法,因为虚拟机保证在调用子类<clinit>方法前,父类<clinit>方法已经执行完毕。
因为父类的<clinit>方法先执行,所以父类静态语句块要优先于子类的静态语句块。
<clinit>方法并不是必须的,如果代码中没有定义静态变量或者静态语句块,则没有<clinit>方法。
类加载器
类加载器的作用就是实现加载阶段的任务,通过一个类的全限定名获取Class文件的二进制字节流。
如果同一个类由两个不同的类加载器加载,得到两个实例,那么这两个实例在虚拟机看来,并不同一种类型。
类加载器可以分成三类:
启动类加载器(Bootstrap ClassLoader),负责将存放在 JAVA_HOME\lib 目录下并且是虚拟机识别的类库加载到虚拟机内存当中来
扩展类加载器(Extension ClassLoader),它负责加载存放在 JAVA_HOME\lib\ext 目录下的类库
用户程序类加载器(Application ClassLoader),它是默认的类加载器,负责加载ClassPath上指定的类库,如果某个类没有特殊指定类加载器,就使用它。
我们的应用程序都是由这三类类加载器完成类加载的,如果需要,我们还可以实现自定义的类加载器完成类加载。它们的关系如下图所示:
上图所展示的类加载器关系,就叫类加载器的双亲委派模型。除了顶层的启动类加载器,其它的类加载器都有自己的父类加载器,但它们不是通过继承实现的,而是通过组合实现的。
双亲委派模型的工作过程是:如果一个类加载器收到了类加载请求,会先请求自己的父类加载器去加载,如果父类无法加载该类,子类才会尝试自己去加载。
protected Class<?> loadClass(String name, boolean resolve){
Class c = findLoadedClass(name);
if (c == null) {
if (parent != null) {
//使用父加载器加载此类
c = parent.loadClass(name, false);
}
if (c == null) {
// 如果父加载器没有成功加载,则自己尝试加载
c = findClass(name);
}
}
return c;
}
查看ClassLoader类的loadClass方法,双亲委派模型从上述代码中实现。
使用双亲委派模型,Java类和它的类加载器一起具备了一种带有优先级的层次关系。例如Object类,无论哪个类加载器来加载它,最后都要委托启动类加载器来加载Object,这就保证了Object在程序的各个类加载器环境中都是同一个类。Java的基本类,基础行为必须被保证,不能被篡改,这就是双亲委派模型的意义所在。