1.前言
前面的几个章节了解了JVM的基础知识,直到了JVM的底层结构及内存的回收策略,这章接着学习JVM加载类的过程
2.目录
3.类的加载过程
虚拟机把描述类的数据从Class文件加载到内存,并对数据进行校验,转化解析和初始化,最终形成可以被虚拟机直接使用的Java类型
- 整个生命周期包括:加载(Loading),验证(Verification),准备(Preparation),解析(Preparation),初始化(Initialization),使用(Using)和卸载(Unloading)7个阶段.其中准备,验证,解析3个部分统称为连接(Linking)
- 加载,验证,准备,初始化和卸载的执行顺序是确定的解析阶段则在某些情况下可以在初始化阶段之后再开始,这就是Java语言的运行时绑定(也称动态绑定或晚期绑定)
3.1.加载阶段
加载阶段有以下三个步骤:
- 通过类的全限定名来获取定义此类的二进制字节流
- 将这个字节流所代表的的静态存储结构转化为方法区的运行时数据结构
- 在内存中生成一个代表这个类的java.lang.Class对象,作为方法区这个类的各种数据的访问入口
其中获取二进制字节流可以通过Class文件,ZIP包,网络,运行时(动态代理),JSP生成,数据库等途径获取
需要注意的是数组类的加载,数组类并不通过类加载器加载,而是由Java虚拟机直接创建,但是数组类还是要依靠类加载器进行加载
这些二进制字节流加载完成之后,按照指定的格式存放于方法区内(Java7及以前方法区位于永久代,Java8位于元空间).然后再方法区生成一个比较特殊的java.lang.Class对象,用来作为程序访问方法区中这些类型数据的外部接口
3.2.验证阶段
验证的目的是确保Class文件的字节流中包含的信息符合当前虚拟机的要求,并且不会危害虚拟机自身的安全
- 文件格式验证:验证字节流是否符合Class文件格式的规范;比如,是否以魔术0XCAFEBABE开头,主次版本号是否在当前虚拟机的处理范围之内,常量池中的常量是否有不被支持的类型.只有验证通过才会进入方法区进行存储
- 元数据验证:对自己饿吗描述的信息进行语义分析,以保证其描述的信息符合Java语言规范的要求;比如,是否有父类(除Object类),父类是否为final修饰,是否实现抽象方法或接口,重载是否正确等
- 字节码验证:通过字节流和控制流分析,确定程序语义是合法的,符合逻辑的.比如,保证数据类型与指令正常配合工作,指令不会跳转到方法体外的字节码上,方法体中的类型转换是有效的等
- 符号引用验证:在虚拟机将符号引用转化为直接引用的时候进行验证,可以看做是对类自身以外的信息(常量池中的各种符号引用)进行匹配性的校验.常见的异常比如:
java.lang.NoSuchMethodError,java.lang.NoSuchFiledError
等
3.3.准备阶段
主被截断主要是正是为类变量分配内存并设置类变量的初始值,变量所使用的内存豆浆在方法区中进行分配
此处的类变量指的是被static修饰的变量,不包含实例变量,实例变量在对象实例化阶段分配在堆中
public static String a = "A";
并且,变量的初始化值并不是类中定义的值,而是该变量所属类型的默认值
当然,也有特殊情况,比如当变量被final修饰时:此时,该字段属性是ConstantValue
时,会在主被截断初始化为指定的值
3.4.解析阶段
解析阶段是虚拟机将常量池内的符号引用替换为直接引用的过程.解析动作主要针对类或接口,字段,类方法,接口方法,方法类型,方法句柄和调用点限定符7类符号引用进行
这里我们看一下字段解析,也就是最开始第一道面试题.当获取SubClass的属性a时,首先会查找SubClass本身是否包含该字段,如果包含则直接返回引用,查找结束
否则,如果SubClass类实现了接口或继承了父类,那么则递归搜索各个接口和父类,找到匹配的属性则返回,查找结束
否则,查找失败,抛出java.lang.NoSuchFieldError
异常.如果返回成功了,但是是权限校验失败,也就是无该字段的访问权限,则抛出java.lang.illegalAccessError
异常
其它形式的解析,就不在这里一一说明了
3.5.初始化阶段
初始化阶段才是真正执行类中定义的Java程序代码(字节码).在此阶段会根据代码进行类变量和其他资源的初始化,或者可以从另一个角度来表达:初始化阶段是执行类构造器<clinit>()
方法的过程
<clinit>()
方法是由编译器自动收集类中的所有变量的复制动作和静态语句块(static语句块)中的语句合并生成的,编译器收集的顺序是由语句在源文件中出现的顺序决定的,静态语句块中只能访问到定义在静态语句块之前的变量,定义在它之后的变量,在前面的静态语句块中可以赋值,但是不能访问
注释掉错误提示行,打印结果为A
,在准备阶段属性a的值为null
,然后类初始化按照顺序执行,首先执行static块中的a="B"
,接着执行a="A"
的复制操作,此时值为A
,当main
方法调用打印时则为A
<clinit>()
方法与实例构造器<init>()
方法不同,它不需要显示地调用父类构造器,虚拟机会保证在子类<clinit>()
方法执行之前,父类的<clinit>()
方法已经执行完毕
由于父类的<clinit>()
方法先执行,也就意味着父类中定义的静态语句块要优先于子类的变量赋值操作
<clinit>()
方法对于类或者接口来说并不是行必须的,如果一个类中没有静态语句块,也没有对变量赋值操作,那么编译器可以不为这个类生产<clinit>()
方法
接口中不能使用静态语句块,但仍然有变量初始化的复制操作,因此接口与类一样都会生成<clinit>()
方法.但接口与类不同的是,执行接口的<clinit>()
方法不需要先执行父接口的<clinit>()
方法.只有当父接口中定义的变量使用时,父接口才会初始化.另外,接口的实现类在初始化时也一样不会执行接口的<clinit>()
方法
虚拟机会保证一个类的<clinit>()
方法在多线程环境中被正确的加锁,同步,如果多个线程同时去初始化一个类,那么只会有一个线程去执行这个类的<clinit>()
方法,其它线程都需要等待,直到活动线程执行<clinit>()
方法执行完毕.如果在一个类的<clinit>()
方法中有耗时很长的操作,就可能造成逗哥线程阻塞,在实际应用中这种阻塞旺旺是隐藏的
- <clinit>:在jvm第一次加载class文件时调用,包括静态变量初始化语句和静态块的执行
- <init>:在实例创建出来的时候调用,包括调用new操作符,调用Class或
java.lang.reflect.Constructor
对象的newInstance()方法,调用任何有对象的clone()
方法,通过java.io.ObjectInputStream
类的getObject()
方法反序列化
3.6.虚拟机规范初始化
虚拟机规范严格规定了有且只有5中情况(jdk1.7)必须对类进行"初始化"(而加载、验证、准备自然需要在此之前开始):
- 遇到new,getStatic,putStatic,invokeStatic这失调字节码指令时,如果类没有进行过初始化,则需要先触发其初始化.生成这4条指令的最常见的Java代码场景是:使用new关键字实例化对象的时候,读取或设置一个类的静态字段(被final修饰,已在编译器把结果放入常量池的静态字段除外)的时候,以及调用一个类的静态方法的时候
- 使用java.lang.reflect包的方法对类进行反射调用的时候,如果类没有进行过初始化,则需要先触发其初始化。
- 当初始化一个类的时候,如果发现其父类还没有进行过初始化,则需要先触发其父类的初始化
- 当虚拟机启动时,用户需要指定一个要执行的主类(包含main()方法的那个类),虚拟机会先初始化这个主类
- 当使用jdk1.7动态语言支持时,如果一个java.lang.invoke.MethodHandle实例最后的解析结果REF_getstatic,REF_putstatic,REF_invokeStatic的方法句柄,并且这个方法句柄所对应的类没有进行初始化,则需要先出触发其初始化
4.小结
这章主要讲解了类的加载过程,对底层数据的存储,分布和加载有了大致的了解,知识点比较多,有一个整体的认识就可以,下一个讲解类加载器及双亲委派机制
原文:https://www.choupangxia.com/2019/10/27/interview-jvm-load-01/