1.概述
不同的虚拟机实现里面,执行引擎在执行代码的时候可能有解释执行(通过解释器执行)和编译执行(通过即时编译器产生本地代码执行)两种,也可能两者兼备,甚至还可能会包含几个不同的编译器执行引擎。
2.运行时栈帧结构
栈帧是用于支持虚拟机进行方法调用和方法执行的数据结构,它是虚拟机运行时数据区中的虚拟机栈的栈元素。
栈帧存储了方法的局部变量表、操作数栈、动态连接、方法返回地址等。每一个方法从调用开始至执行完成都对应的一个栈帧在虚拟机栈入栈到出栈的过程。
编译代码的时候,栈帧中需要多大的局部便链表,多深的操作数栈已经完全确定了,所以一个栈帧需要分配多少内存,不会受程序运行期变量数据的影响。
对引擎来说,在活动线程中,只有位于栈顶的栈帧才是有效的,称当前栈帧,与这个栈帧相关联的方法称当前方法。执行引擎运行的所有字节码指令都只针对当前栈帧进行操作。
2.1 局部变量表
是一组变量值存储空间,存放方法参数和方法内定义的局部变量。Java编译为Class文件时,就在方法的Code属性的max_locals数据项中确定了该方法所需要分配的局部变量表的最大容量。
在方法执行时,虚拟机是使用局部变量表完成参数值到参数变量表到传递过程的。如果执行的是实例方法(非static方法),局部变量表第0位索引的slot默认是用于传递方法所属对象实例的引用,在方法中可以通过"this"访问。其余参数按照参数表顺序排列,占用从1开始的局部变量slot。
变量槽slot是最小单位,具体多少长度是随着处理器、操作系统或虚拟机的不同而变化的。
2.2 操作数栈
它是一个后入先出栈,最大深度也在编译的时候写入到Code属性到max_stacks数据项中。
2.3 动态连接
每个栈帧包含一个指向运行时常量池中该栈帧所属方法到引用,持有这个引用是为了支持方法调用过程中到动态链接。我们知道Class文件的常量池存有大量的符号引用,字节码中的方法调用指令以常量池中指向方法的符号引用作为参数。
这些符号引用一部分在类加载阶段或第一次使用的时候转化为直接引用,称静态解析。另一部分在运行期间转化为直接应用,为动态连接。8.3中详解。
2.4 方法返回地址
方法推出的过程实际上是把当前栈帧出栈:恢复上层方法的局部变量表和操作数栈,把返回值压入调用者栈帧的操作数栈中,调整PC计数器的值以指向方法调用指令后面的一条指令。
3.方法调用
方法调用同于方法执行,它唯一的任务是确定被调用方法的版本(即调用哪一个方法),不涉及方法内部的具体运行过程。
3.1 解析
方法调用的目标方法在Class文件里面都是一个常量池的引用,在类加载阶段,会将其中一部分符号引用转化为直接引用,这种解析的前提是:调用目标程序代码写好、编译器进行编译时就必须确定下来。
而分派调用可能是静态的也可能是动态的,根据分派一句的宗量数可分为单分派和多分派。
3.2 分派
1.静态分派
查看下面示例,想一下程序输出结果是什么。
/**
* @program: 方法静态分派演示
* @description:
* @author: seanol
**/
public class StaticDispatch {
static abstract class Human{}
static class Man extends Human{}
static class Woman extends Human{}
public void sayHello(Human guy){
System.out.println("hello guy");
}
public void sayHello(Man guy){
System.out.println("hello man");
}
public void sayHello(Woman guy){
System.out.println("hello woman");
}
public static void main(String[] args) {
Human man = new Man();
Human woman = new Woman();
StaticDispatch sd = new StaticDispatch();
sd.sayHello(man);
sd.sayHello(woman);
}
}
运行结果:
hello guy
hello guy
Human man = new Man();
"Human"称为变量的静态类型,或者外观类型,后面的"Man"称为变量的实际类型。它们的区别是静态类型的变化仅仅在使用时发生,变量本身的静态类型不会改变,并且最终的静态类型是编译器可知的;实际类型变化的结果在运行期才能确定。
再看上面的例子,main()里面的两个sayHello(),在方法接受者已经确定是对象"sd"后,使用哪个重载,完全取决于传入参数的数量和数据类型。虚拟机(编译器)在重载时通过参数的静态类型而不是实际类型作为判断依据。
所有依赖静态类型来定位方法执行版本的分派动作称为静态分派。典型应用就是方法重载。编译器虽然能确定方法重载的版本,但很多情况下这个重载版本不是唯一的。
主要原因是字面量不需要定义,所以字面量没有显式的静态类型。
例如'a'字面量会按照char->int->long->float->double的顺序转型。但不会匹配到byte和short类型的重载,因为char到byte或short的转型是不安全的;如果重载的方法参数类型都没有上面的类型,会发生自动装箱,'a'被包装为java.lang.Character,接下来是java.lang.Serializable(Character实现了它);如果还没有以这些类型作为参数的重载方法,继续寻找以Object作为参数的方法;如果还么有会寻找以可变长参数的方法(优先级最低)。
2.动态分派
动态分派和重写有着密切关系。
3.单分派和多分派
方法的接受者与方法的参数统称为方法的宗量,根绝分派基于多少种宗量,可以将分派分为单分派和多分派。单分派根据一个宗量对目标方法进行选择,多分派根据多个宗量对目标方法进行选择。
现在的Java(1.8)是一门静态多分派,动态单分派的语言。
4.基于栈的字节码解释执行引擎
4.1解释执行
如今,大部分语言都会遵循现代经典编译原理的思路:在执行前先对程序源码进行词法分析和语法分析处理,把源码转化为抽象语法树。
对于一门具体语言对实现来说,词法分析、语法分析、优化器和目标代码生成器都可以选择独立于执行引擎,形成一个完整意义都编译器去实现,这类代表是C\C++。也可以选择其中一部分步骤(如生成抽象语法树之前的步骤)实现为一个半独立的编译器,这类代表是Java。
Java中,Javac编译器完成程序代码经过词法分析、语法分析到抽象语言树,再遍历语法树生成线性的字节码指令流的过程。因为这部分动作是在Java虚拟机之外进行,解释器是虚拟机内部的,所以Java程序的编译是半独立的实现。
4.2 基于栈的指令集与基于寄存器的指令集
Java编译器输出的指令流,基本上是基于栈的指令集架构,指令流中的指令大部分是零地址指令,它们以来操作数栈进行工作。与之相对的另外一套常用的指令集架构是基于寄存器的指令集,最典型的是x86的二地址指令集。
基于栈的指令集主要优点是可移植,寄存器由硬件直接提供,程序直接依赖这些硬件寄存器则不可避免的要收到硬件的约束;代码相对更加紧凑(字节码中每个字节对应一条指令)、编译器实现更加简单(不需要考虑空间分配问题)等。
主要缺点是执行速度相对会慢一些。完成相同功能所需要的指令数量一般比寄存器架构多;栈实现在内存中,频繁的栈访问意味着频繁的内存访问。
4.3基于栈的解释器执行过程
下面看一个四则运算的例子:
public int clac(){
int a = 100;
int b = 200;
int c = 300;
return (a + b) * c;
}
我们使用javap命令查看它的字节码指令:
笔者帮我们画了7张图,描述执行过程: