本文主要描述了Dalvik虚拟机中 Class 从加载到实例化过程。文中不贴代码,因为代码处理有些繁琐。将代码的操作过程全部抽象成图,理解起来更加直观。
1 Odex文件布局
- Java层创建ClassLoad并加载一个DexFile,Native层返回DexOrJar对象指针,表示 map 映射后的DexFile
- DexFile对象中保存了map 后的 Odex 文件索引信息,在解析odex文件中 Class 时候需通过该对象来获取 Class 的具体信息
2 类加载、链接、初始化
- 加载:dalvik虚拟机分配ClassObject结构体表示一个成功加载的类,并从OdexFile中解析 Class 的相关信息:接口,方法,成员变量,静态成员等。
- 链接:根据加载阶段获取到的类的成员信息进行链接操作,包括递归加载父类,实现的接口,并创建虚函数表,接口函数访问表,并调整实例成员的布局(为了对齐,紧凑),计算实例的大小。
- 初始化:初始化推迟到实例对象或者第一次使用类的静态成员才进行,包括验证类,优化方法,递归初始化父类,初始化静态成员变量,执行静态代码块等操作。
如上图“橙色”框表示了类在加载–>初始化的各个状态。要真正实例化一个类对象,该类的状态必须已经完成 load, link, init三个阶段,也即处于“CLASS_INITIALIZED"状态,该状态字段保存于ClassObject中。
2.1 类加载、链接
ClassObject在Load,Link完成工作如下图表示:
- 创建虚函数表vtable,上部分继承自父类。当有覆盖方法时,直接将Method指针指向当前类的Method对象即可;
- 非实例方法由directMethods数组表示;
- Iftable表示所有接口入口,每个接口对应的方法都在ifvPool数组中连续表示。ifvPool中保存的是vtable数组的索引。因此,方法通过ifvPool间接映射到Method中;
- super保存父类指针;
- interface保存接口指针;
- sfields[]中保存静态成员变量的信息,在Load阶段获取,并且分配好空间,在init阶段初始化;
- objectSize是真正实例一个对象,在dalvik堆中的大小,包括继承自父类的大小,4字节对齐;
- status 保存了该类处于的状态。
2.2 类初始化
类初始化(init)主要由2个阶段完成:
2.2.1 阶段一
在init阶段,虚拟机首先对类进行检查,主要是对类方法所有指令,包括参数,返回值,方法体。
(1)方法参数检查
参数中如果是类类型,则会检查类是否已经初始化,否则触发ClassLoad流程,加载并出示该类。如果加载失败,则用Object代替。如果连Object类(虚拟机启动阶段加载)都找不到,那直接报错返回,类初始化失败。
(2)方法指令检查
实例化、用类静态成员指令(如:new-instance, sget, sput, invoke-static),类型转换(check-cast),类型判断(instancd-of)指令。虚拟机判断类是否已经初始化该类,否则触发ClassLoad加载并初始化该类。另外,如果加载类失败,虚拟机会将对应指令替换为OP_THOROW_VERIFICATION_ERROR指令,当虚拟机真正执行到这条指令时,即抛找不到类的异常;
(3)返回指令检查
即返回指令(return-object),若检查到返回的类没有初始化,则触发ClassLoad加载该类。失败的话,则用类Object替换。
在完成所有指令的检查后,虚拟机还会针对一些访问volitile, final修饰成员的指令进行优化,主要是替换成虚拟机内部的指令,提高性能。
检查父类是否已经正常初始化,否则递归初始化父类。
最后,初始化静态域,执行静态代码块,完成类的初始化。到这个阶段,就可以开始使用这个类了,如其静态成员,实例化对象。引起类初始化4条典型指令:
- 反射机制newInstance;
- new关键字;
- 首次引用类静态变量,sget/sput;
- 首次引用类静态方法,invoke-static;
虚拟机在执行到上面4条指令,都会先判断类是否已经初始化,否则会触发类的加载初始化,失败则抛ClassNotFound的异常。newInstance,new贴一张图说明,反射机制流程请参考本文前面。
2.2.2 阶段二
找到类的初始化方法“<clinit>”由 静态域初始化操作,静态代码块组成,然后执行"<clinit>”初始化方法,对类的静态域进行初始化。
2.2.3 “阶段一”不是必须的
类始化过程中的“阶段二”是必须的,但阶段一需要试情况而定。
分2种情况来看待。加载dex文件时,会进行opt操作,其中一个dvmVerifyClass()的操作,该操作主要针对dex中每个类中引用的类是否在同一个dex文件中进行检查:
- 若该类引用到了不再当前dex文件中的类,则accessFlags中不会打上CLASS_ISPREVERIFIED的标记,表示该类还没verify,在真正初始化该类时,会触发verify的操作。这种情况下,类的初始化则需经历“阶段一”,“阶段二”两个操作。
- 若该类内部引用到的类都在当前的dex文件中,则会在odex的accessFlags中打上CLASS_ISPREVERIFIED的标记,表示该类已verify过了,在真正初始化该类时,不需要再做verify操作。类的初始化则需要“阶段二”的操作即可。
3 实例化
类的实例化主要分2个步骤:
- 在虚拟机堆分配实例对象的空间;
- 执行构造函数对实例成员进行初始化(编译生成的构造函数执行顺序为:父类构造最前,其次是实例变量初始化指令,最后是程序员写的构造函数代码)。
4 总结
dalvik虚拟机类加载流程可分为2个大过程:
- 构造DexFile对象表示一个加载并且解析后的Dex文件;
- 构造ClassObject对象表示虚拟机成功加载的类。
在实例化或引用引用类的静态成员,都有时机触发ClassLoad去加载尚未加载的类:
- 父类,接口在加载阶段会递归加载;
- 若该类还没verify,则 类的“方法参数”、“方法体中”、“返回值” 引用到的类都会在当前类初始化阶段加载(实例变量在构造方法中、静态成员在<clinit>方法中);
- 初始化阶段会递归先初始化父类。
类在虚拟机内有9个生命期状态,主要分4个阶段:初始阶段,load,link,init。总之,在我们能够真正使用这个类的时候,类的状态会必须是在:CLASS_INITIALIZED状态,表示这个类已经初始化完成了。