在Class文件中描述了各种信息,最终都需要加载到虚拟机中才能运行和使用,而虚拟机是如何加载这些Class文件呢?Class文件信息进入到虚拟机后会发生什么变化?
虚拟机把描述类的数据从Class
文件[加载]到内存,并对数据进行[验证]、[准备]、[解析]、[初始化],最终形成可以被虚拟机直接[使用]的Java类型,这就是虚拟机的类加载机制。
1. 类加载的生命周期
类从被加载到虚拟机内存中开始,到被卸载出内存为止,他的生命周期:
- 加载(Loading):将class文件读取到内存,并在内存中生成class对象;
- 验证(Verification):确保class文件内容符合虚拟机要求;
- 准备(Preparation):为静态变量分配内存并初始化;
- 解析(Resolution):将常量池内的符号引用替换为直接引用;
- 初始化(Initialization):根据程序制定的主观计划去初始化类变量和其他资源。
- 使用(Using)
- 卸载(Unloading)
而其中的验证
、准备
、解析
三个部分统称为连接(Linking)
。
加载
、验证
、准备
、初始化
、卸载
这5个阶段顺序是确定的,类加载过程中必须按照这个顺序执行。而解析
阶段则不一致。解析
阶段,在某些情况下,可以在初始化阶段之后再开始,这是为了支持Java语言的运行时绑定(也称为动态绑定)
2. 类加载的过程
Java虚拟机中类加载的全过程,也就是
加载
、验证
、准备
、解析
、初始化
这5个阶段执行的具体动作。
2.1 加载
需要类加载器的参与。将class文件读取到内存中。(用户可自定义类加载器,参与加载过程)。
在加载阶段,虚拟机需要完成:
- 通过(类加载器)将一个类的全限定名来获取定义此类的二进制字节流。
- 将这个字节流所代表的静态存储结构转化为方法区的运行时数据结构。
- 在内存中生成一个代表这个类得
java.lang.Class
对象,作为方法区这个类的各种数据的访问入口。
注意:虚拟机规范的这三点要求其实都不算具体。例如通过一个类的全限定名来获取定义此类的二进制字节流
。可以通过:
- 从ZIP包中读取,最终成为日后JAR、EAR、WAR格式的基础。
- 从网络中获取,这种场景最典型的的应用就是
Applet
。 - 运行时计算生产,这种场景使用最多的就是动态代理技术。在
java.lang.reflect.Proxy
中,就是用了ProxyGenerator.generateProxyClass
来为特定接口生成形式为*$Proxy
的代理类的二进制字节流。 - 由其他文件生成,典型场景是JSP应用,即由JSP文件生成对应的Class类。
加载阶段完成后,虚拟机外部的二进制字节流就按照虚拟机所需的格式存储在方法区之中。方法区中的数据存储格式由虚拟机实现自行定义。然后在内存中实例一个java.lang.Class
类的对象(不一定是在堆上呢。对于HotSpot
虚拟机来说,Class对象比较特殊,虽然是对象,但是存放在方法区里面。)这个对象将作为程序访问方法区中这些类型数据的外部接口。
2.2 验证
验证阶段是连接阶段Linking
的第一步,这一阶段的目的是为了确保Class文件的字节流中包含信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全。
对于虚拟机的类加载来说,验证阶段是一个非常重要的,但不是一定必要(因为对程序运行期没有影响)的阶段。如果所运行的全部代码都已经被反复使用和验证过,那么在实施阶段就可以考虑使用-Xverify:none
参数来关闭大部分的类验证措施,以缩短虚拟机类加载时间,
2.3 准备
准备阶段是正式为类变量分配内存
并设置类变量初始值
的阶段,这些变量所使用的内存都将在方法区中进行分配。
这时候进行内存分配的仅包括类变量即
static
变量,而不包括实例变量,实例变量将在对象实例化时随着对象一起分配在Java
堆里。这里说的初始值“通常情况”下是数据类型的零值。假设一个类变量的定义:
public static int value=123
,那变量value
在准备
阶段过后的初始值是0而不是123。因为这时候尚未开始执行任何Java方法,而把value赋值给123的动作是在初始化阶段
才会被执行的。但是
public static final int value=123
在准备阶段,属性就会被赋予用户希望的值。
2.4 解析阶段
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程。
解析动作主要针对类或接口、字段、类方法、接口方法、方法类型、方法句柄和调用点限定符7类符号引用进行的。
2.5 初始化阶段(重点)
类初始化阶段是类加载过程的最后一步,前面的类加载过程中,除了加载阶段
用户应用程序可以通过自定义类加载器参与之外。其余动作完成由虚拟机主导和控制。到了初始化阶段,才真正开始执行类中定义的Java程序代码(或者说是字节码)。
在准备阶段
,变量已经赋过一次系统要求的初始值,在初始化阶段
,则根据程序员通过程序制定的主观计划去初始化类变量和其他资源。
初始化的顺序:
无父类的情况下:
- 静态成员变量、静态代码块(按出现的顺序)
- 成员变量、代码块(按出现的顺序)
- 构造方法
有父类的情况下:
- 父类静态成员,父类静态代码块
- 子类静态成员,子类静态代码块
- 父类成员变量,父类代码块
- 父类构造方法
- 子类静态成员,子类代码块
- 子类构造方法
还有一个小坑,就是重写方法:
下面请看这道面试题最终会输出什么?
父类:
public class Feb {
private String name="feb";
public Feb(){
tellMQ();
tellRedis();
}
public void tellMQ(){
System.out.println("The Feb MQ name is "+name);
}
public void tellRedis(){
System.out.println("The Feb Redis name is "+name);
}
}
子类:
public class Sub extends Feb{
private String name="sub";
public Sub(){
super();
tellMQ();
tellRedis();
}
public void tellMQ(){
System.out.println("The Sub MQ name is "+name);
}
public void tellRedis(){
System.out.println("The Sub Redis name is "+name);
}
//执行该方法后,会输出什么数据
public static void main(String[] args) {
Feb object=new Sub(); //动态绑定
}
}
由于类的初始化过程:
父类的常量->父类的构造方法->子类的常量->子类的构造函数
在类的加载时机
中我们知道,JVM严格规范了5种情况需要立即对类进行初始化。此时满足:初始化一个类的时候,如果发现父类还未初始化,则需先触发父类初始化
,于是初始化父类的变量后,执行父类的构造方法时。由于发生了多态(动态绑定)于是在子类中找到的了该方法。执行子类的方法。
由于子类的name属性没有初始化(什么?父类有name,但是父类的访问修饰符是private,子类不能继承呀),所以最后返回的是null。
类初始化的条件
什么时候对类进行加载Loading
,JVM并没有强制约束。但是对于初始化Initialization
,JVM严格规定了5种情况下必须立即对类进行初始化(而加载
、验证
、准备
自然要在此前开始)。
- 遇到
new
、getstatic
、putstatic
、invokestatic
这4条字节码指令时,如果类没有进行初始化,那么就需要先触发其初始化。(咳咳,说人话...)生成这4条指令最常见java代码就是:new一个对象、读取或者设置一个类的静态字段(需要注意:被final修饰的常量在编译期把结果放入常量池。那么不会创建对象)的时候,以及调用一个类的静态方法的时候。 - 使用
java.lang.reflect
包的方法对类进行反射调用的时候,如果类没有初始化,则需要先触发其初始化。 - 当初始化一个类的时候,如果发现其父类还没有初始化,则需要先触发初始化。
- 虚拟机启动时,用户需要指定一个要执行的主类(包含
main
方法的类),虚拟机就会先初始化这个主类。 - 当使用JDK1.7的动态语言支持时,如果一个
java.lang.invoke.MethodHandle
实例的最后解析结果是REF_getstatic
、REF-putstatic
、REF_invokeStatic
的方法句柄,并且这个方法的句柄所对应的类没有进行初始化,则需要先触发其初始化。
这5种场景中的行为被称为对一个类进行主动引用
,除此之外,所以引用类的方式都不会触发初始化,称为被动引用
。
- 例如,使用子类引用父类的静态字段时,不会导致子类初始化。
- 通过数组定义来引用类,不会触发此类的初始化。
-
final
修饰的常量,会在编译期就存入调用类的常量池中。本质上并没有直接引用定义常量的类,因此不会触发定义常量的类的初始化。
注意:当一个类在初始化时,要求其父类全部都已经初始化,但是一个接口初始化时,并不要求其父接口全部完成初始化,只有在真正使用到父接口的时候(如:引用接口中定义的常量)才会初始化。
类加载的时机
在Java语言里面,类型的加载、连接(验证,准备,解析)和初始化过程都是程序运行期完成的。这种策略虽然令类加载时稍微增加一些性能开销,但是会为Java应用程序提供了高度的灵活性。Java里面天生可以动态扩展语言的特性就是依赖运行期动态加载和动态连接这个特点实现的。
举几个栗子:
- (多态)编写一个面向接口的应用程序,可以等到运行时在指定其实际的实现类;
- 用户可以通过Java预定义的和自定义的
类加载器
,让一个本地的应用程序可以在运行时从网络或其他地方加载一个二进制流作为程序代码的一部分,这种组装应用程序的方式目前已广泛应用于Java程序中。
3. 类加载器
虚拟机将类
加载
阶段中的“通过一个类的全限定名来获取描述此类的二进制字节流”
这个动作放到java虚拟机外部
去实现,以便让应用程序自己决定如何获取所需要的类,实现这个动作的代码模块被称为“类加载器”。
类加载器虽然是只用于实现类的加载动作,但它在java程序中起到的作用远远不限于类加载阶段
。
/测试类加载器
public class ClassLoaderTest {
public static void main(String[] args) {
//定义类加载器(局部内部类)
ClassLoader myLoader = new ClassLoader() {
@Override
public Class<?> loadClass(String name) throws ClassNotFoundException {
//获取文件名.class格式的
try {
String fileName = name.substring(name.lastIndexOf(".") + 1) + ".class";
InputStream is = getClass().getResourceAsStream(fileName);
if (is == null) {
return super.loadClass(name);
}
byte[] bytes = new byte[is.available()];
is.read(bytes);
return defineClass(name, bytes, 0, bytes.length);
} catch (IOException e) {
throw new ClassNotFoundException("没有找到对应的class类!");
}
}
};
try {
//同一个Class文件,被不同的类加载器所加载
Object obj = myLoader.loadClass("com.ms.ClassLoaderTest").newInstance();
System.out.println(obj.getClass());
//那么这两个类必定不相等
System.out.println(obj instanceof com.ms.ClassLoaderTest);
} catch (ClassNotFoundException e) {
e.printStackTrace();
} catch (IllegalAccessException e) {
e.printStackTrace();
} catch (InstantiationException e) {
e.printStackTrace();
}
}
}
对于任意一个类,都需要由加载它的类加载器和这个类本身一同确立其在Java虚拟机中的唯一性
比较两个类是否“相等”,只有在这两个类是由同一个类加载器加载的前提下才有意义,否则,即使这两个类来源于同一个Class
文件,被同一个虚拟机加载,只要加载它们的类加载器不同,那么这两个类就必定不相等。
3.1 双亲委派模型
从虚拟机角度来说,只存在两种不同的类加载器。一种是启动类加载器(Bootstrap ClassLoader)
,这个类加载器是使用C++实现的。是虚拟机自身的一部分;另一种就是所有其他的类加载器,这些类加载器都是由Java语言实现,独立于虚拟机外部,并且全部继承自抽象类java.lang.ClassLoader
。
从java开发人员的角度来看,类加载器还可以划分得更细致一些,绝大部分java程序都会使用以下3种系统提供的类加载器。
启动类加载器(
Bootstrap ClassLoader
):负责将存放在<JAVA_HOME>\lib
目录中的,或者被-Xbootclasspath
参数所指定的路径中的,并且被java虚拟机识别的(仅按照文件名识别,如rt.jar
,名字不符合即使放在lib目录下也不会被加载)类库加载到虚拟机内存。启动类加载器无法被Java程序直接引用,用户在编写自定义加载器时,如果需要把类加载请求委派给引导类加载器,那可以直接使用null
代替即可。扩展类加载器(
Extension ClassLoader
):这个类加载器由sun.misc.Launcher$ExtClassLoader
实现,它负责加载<JAVA_HOME>\lib\ext
目录中的,或者被java.ext.dirs
系统变量所指定的路径中的所有类库,开发者可以直接使用扩展类加载器。应用程序类加载器(
Application ClassLoader
):这个类加载器由sun.misc.Launcher$AppClassLoader
实现,这个类加载器是ClassLoader
中的getSystemClassLoader
方法的返回值,所以一般也称为系统类加载器,他负责加载用户类路径(ClassPath
)上所指定的类库,开发者可以直接使用这个类加载器,如果应用程序中没有自定义过自己的类加载器,一般情况下这个就是程序中默认的类加载器。
我们的应用程序都是由这3种类加载器相互配合进行加载的,如果有必要,还可以加入自己定义的类加载器,这些类加载器之间的关系一般是:
上图展示的类加载器之间的层次关系,被称为类加载器的双亲指派模型(Parents Delegation Model
)。双亲委派模型要求除了顶层的启动类加载器外,其余的类加载器都应当有自己的父类加载器。这里类加载器之间的父子关系一般不会以继承
的关系来实现,而是都是以组合
关系来复用父加载器的代码。
双亲委派模型的工作过程:
如果一个类加载器收到类加载的请求,他首先不会自己去尝试加载这个类,而是把这个请求委派给父加载器去完成,每一个层次的类加载器都是如此,因此所有的加载请求最终都应该传送到顶层的启动类加载器(Bootstrap ClassLoader
)中,只有父加载器反馈自己无法完成这个加载请求(即:他的搜索范围中没有找到所需的类)时,子加载器才会尝试自己去加载。
小胖说:对于类加载请求,都会委派自己的上级加载器,若上级加载器不能加载,则子加载器才会尝试。
双亲委派模型的优点:
使用双亲委派模型来组织类加载器之间的关系,有一个显而易见的好处就是Java类随着它的类加载器一起具备一种带有优先级的层次关系。例如java.lang.Object
,他存放在rt.jar
之中,无论哪一个类加载器需要加载这个类,最终都会委派给处于模型
最顶端的启动类加载器进行加载,因此Object
类在程序的各种类加载器环境中都是同一个类。
如果不使用双亲委派模型
,由各个类加载器自行去加载的话,如果用户自己编写了一个称为java.lang.Object
的类,并放在程序的ClassPath
中,那系统中将会出现多个不同的Object
类。
双亲委派模型源码分析:
protected Class<?> loadClass(String name, boolean resolve)
throws ClassNotFoundException
{
synchronized (getClassLoadingLock(name)) {
// 首先,检查class类是否被加载
Class<?> c = findLoadedClass(name);
if (c == null) {
long t0 = System.nanoTime();
try {
if (parent != null) {
c = parent.loadClass(name, false);
} else {
c = findBootstrapClassOrNull(name);
}
} catch (ClassNotFoundException e) {
// 如果父加载器抛出ClassNotFoundException异常
// 那种说明父加载器无法完成加载请求
}
if (c == null) {
// 在父加载器没有找到的情况下,调用本身的findClass()进行加载
long t1 = System.nanoTime();
c = findClass(name);
// this is the defining class loader; record the stats
sun.misc.PerfCounter.getParentDelegationTime().addTime(t1 - t0);
sun.misc.PerfCounter.getFindClassTime().addElapsedTimeFrom(t1);
sun.misc.PerfCounter.getFindClasses().increment();
}
}
if (resolve) {
resolveClass(c);
}
return c;
}
}
3.2 破坏双亲委派模型
上面所说的双亲委派模型并不是一个强制性的约束模型,而是Java
设计者推荐给开发者的类加载器的实现方式。
双亲委派模型三次被破坏的情况:
双亲委派模型是
JDK 1.2
才加入的,而类加载器和抽象类的java.lang.ClassLoader
则在JDK 1.0
就存在,为了兼容已经存在的用户自定义类加载器的实现代码JDK 1.2
之后的java.lang.ClassLoader
添加了一个新的protected
方法findClass()
。
JDK 1.2
之前,用户继承java.lang.ClassLoader
的唯一目的就是为了重写loadClass()
方法。因为虚拟机在进行类加载的时候,会调用加载器的私有方法loadClassInternal()
,而这个方法的唯一逻辑就是去调用自己的loadClass()
。我们在上面看到loadClass()
的代码。双亲委派的具体逻辑就实现在这个方法之中。
JDK 1.2
之后,提倡用户将自己的类加载器逻辑写在findClass()
方法中,那么在loadClass()
方法的逻辑里如果父类加载失败,则会调用自己的findClass()
方法来完成加载。这样就保证新写出来的类加载器符合双亲委派模型。双亲委派很好的解决了各个类加载器的基础类的统一问题(越基础的类由越上层的加载器进行加载),基础类之所以称为“基础”。是因为他们总是作为被用户代码调用的API但是集成类又要回调回用户的代码,那该怎么办?
为了解决这个问题,Java设计团队引入了不太优雅的设计:线程上下文加载器(Thread Context ClassLoader
)。这个类加载器可以通过java.lang.Thread
类的setContextClassLoader()
方法进行设置,如果创建线程时还没有设置类处理器
,线程将继承其父线程的上下文加载器,如果在应用程序的全局范围内都没有设置过的话,那么这个类加载器默认就是应用程序类加载器。
有了线程上下文类加载器,就打破双亲委派模型的层次结构逆向使用类加载器了。即:父类加载器请求子类加载器完成类加载的动作。
是不是没搞懂线程上下文加载器
到底有啥用吧?
Java提供了很多服务提供者接口(Service Provider Interface SPI)
允许第三方为这些接口提供服务。
SPI的实现一般是由应用加载器Application ClassLoader
加载的,导致启动类加载器Bootstrap ClassLoader
无法找到SPI的实现类,因为它只加载Java核心库。那么Bootstrap Classloader
所加载的代码需要反过来委托左边的UserClassLoad
加载数据的时候,就需要设置线程的上下文加载器。
在SPI接口的代码中使用线程上下文加载器,就可以成功的加载到SPI实现的类。大部分的java application服务器(jboss
,tomcat
)也是采用contextClassLoader
来处理java服务。还有一些热部署hot swap
特性的框架,也使用了线程上下文加载器。