本文主要内容
- 解释执行
- 基于栈的指令集与基于寄存器的指令集
- 基于栈的解释器执行过程
上一篇文章学习了方法调用过程,虚拟机或编译器是如何决定调用哪个方法的,本文主要学习方法的具体执行过程。
解释执行
目前,大部分代码到物理机的目标代码或虚拟机能执行的指令集之前,都需要经过下图的各个步骤。图中下面的分支,就是传统编译原理中程序代码到目标机器代码的生成过程,而中间的那条分支自然就是解释执行的过程。
如今,各种语音,大多都遵循这种基于现代经典编译的思路,在执行前先对程序源码进行词法分析和语法分析处理,把源码转化成抽象语法树。
基于栈的指令集和基于寄存器的指令集
Java编译器输出的指令流,基本上是基于栈的指令集架构。指令流里的指令大部分是零地址指令,它们依赖操作数栈进行工作。
与之相对的是基于寄存器的指令集,目前主流PC中直接支持的指令集架构就是基于寄存器的。
以一个例子来说明二者的区别,分别使用两种指令集来计算 1+1 的结果,基于栈的指令集会是这样:
两条iconst_1指令连续地将两个常量1压入栈中,iadd指令将栈顶的两个值出栈并相加,然后把结果放回栈顶,最后istore_0把栈顶的值放到局部变量表的第0个slot中
有同学可能会有疑问,为啥计算 1+1 还得把两个1压栈呢?因为基于栈的指令集有一个特征,大部分指令是零地址指令,指令后面不跟操作数的地址,只能从栈中取
如果是基于寄存器的指令集,那么程序可能是这个样子:
mov指令把EAX寄存器的值设置为1,然后add指令再把这个值加1,结果就保存在EAX寄存器里。
寄存器的指令后边跟着操作数,这就是与基于栈的指令集之差的差异点。
两种指令集同时并存和发展,各有优劣。
基于栈的指令集最大优点就是可移植性,寄存器由硬件直接提供,程序直接依赖这些硬件寄存器则不可避免要受到硬件制约,栈架构还有其它优点,如代码更紧凑,编译器实现更简单等。它的主要缺点就是执行速度相对慢一点,因为入栈和出栈操作太多,完成相同功能的指令数量会把寄存器架构多。而且栈在内存中,频繁访问栈,就意味着频繁访问内存,对于处理器来说,内存始终是执行速度的瓶颈。
所以主流物理机的指令集都是寄存器架构也从侧面印证了这一点。
基于栈的解释器执行过程
本节准备一段代码,看看虚拟机实际上是如何执行的。
public int calc(){
int a = 100;
int b = 200;
int c = 300;
return (a + b) * c;
}
使用 javap 命令看看它的字节码指令
javap提示这段代码需要深度为2的操作数栈和4个slot的局部变量空间。
- bipush的作用是:将单字节整形常量推入操作数栈顶,后跟一个参数,指明推送的常量值
- sipush的作用是:将一个短整型的常量推入操作数栈顶
- istore_1的作用是:将操作数栈顶的整形值出栈并存放在第1个局部变量slot中
- iload_1的作用是:将局部变量的第1个slot中的整型值复制到操作数栈顶
- iadd的作用是:将操作数栈中的前两个栈顶元素出栈,做整型加法,然后结果重新入栈
- imul的作用是:将操作数栈中的前两个栈顶元素出栈,做整型除法,然后把结果重新入栈
明白了各指令的意义,再来看整个方法,非常简单。
0~10这几步是将100、200、300这三个常量分别推入操作数栈顶,然后出栈并且复制到局部变量表中。11到12步,从局部变量表中取出常量复制到操作数栈,iadd,将操作数栈顶的两个元素相加,结果依然入栈,接下来的乘法也差不多。
从以上可以看出栈结构指令集的一般运行过程,整个运算过程的中间变量都以操作数栈的出栈和入栈为信息交换途经