代码编译的结果就是从本地机器码变为字节码
- 执行引擎在执行java代码可以解释执行(通过解释器执行)也可以编译执行(通过即时编译器产生本地代码执行)
运行时的栈帧结构
- 栈帧支持方法调用和方法执行的数据结构,
- 栈帧存储了方法的局部变量表(参数),操作数栈(对应着代码的操作),动态链接和方法返回地址等信息
- 每一个方法从调用开始到执行完成的过程,就对应着一个栈帧在虚拟机栈里面从入栈到出栈的过程。
- 对于执行引擎来说,活动线程中,只有栈顶的栈帧是有效的,称为当前栈帧,这个栈帧所关联的方法称为当前方法。执行引擎所运行的所有字节码指令都只针对当前栈帧进行操作。
- 编译器局部变量表大小和操作数栈的深度都已经确定,因此一个栈需要多大内存也已经确定
局部变量表
用于存放方法参数和方法内部定义的局部变量。
出现在方法表中的code属性的max_locals数据项中确定了该方法所需要分配的最大局部变量表的容量。
以slot 为最小单位,slot 没有说明他的长度 但是起码可以接受八中类型(基本类型和引用以及returnAddress)
slot可以重用,只要方法定义的变量超出作用域既可以覆盖,这样做不仅仅节省栈空间,还可以方便对象回收,因为对象超出作用域,但是如果slot没被回收,那么对象还是无法被回收,这是因为slot还存在对对象的引用。(局部变量表中的slot 也属于GC roots)
操作数栈
- 对应方法表中的code属性的max_stacks
- 操作数栈的每一个元素可以是任意的java数据类型
- 方法开始执行时候操作数栈是空的,方法执行过程对应的像操作数栈写入和提取内容。例如算术运算,或者方法内部调用其他方法时候是通过操作数栈传递参数
- jvm会做优化让两个栈帧重叠异步,让下面的栈帧(主动调用方法)的部分操作数栈与上面栈帧(被动调用方法)的局部变量表重叠在一起。(栈中在下面的方法是主动调用上面的方法,这样就可以吧操作数栈中的数据传递给上面方法的局部变量表做参数)避免了栈帧之间的拷贝
- 比如我们要在一个方法中调用某个方法,那么我们的方法需要的参数必然已经存放在操作数栈帧中
动态链接
- 每个栈帧都包含一个指向运行时常量池中该栈帧所属哪个方法的引用。
- 持有该引用是为了支持方法调用过程中的动态链接
- 我们的符号引用会在类加载和方法运行期间解析成直接引用这就是动态链接
方法返回地址
- 方法被执行退出条件有两种:执行遇到了方法返回的字节码指令,或者遇到异常且该异常没有在方法中处理
- 正常退出的时候调用者的pc计数器可以作为返回地址,栈帧中可能保存这个计数器值
- 异常退出的时候,返回地址是通过异常表来确定的,栈帧一般不会保存这部分信息
- 栈帧退出的操作,恢复上层方法的局部变量表和操作数栈,把返回值亚茹调用者栈帧的操作数栈,调整pc计数器的值
方法调用
- 方法调用并不等同于方法执行,方法调用阶段唯一的任务就是确定被调用方法的版本(即调用那个一个方法)
- class文件编译不包含传统编译中的连接这一步骤,一切方法调用在class文件里面存储的都是符号引用,而不是方法在实际运行时候内存布局的入口地址(即直接引用)
解析
- 在类加载就能确定调用那个方法的符号引用会被直接解析
- 符合在编译器可知,运行不可变的就是静态方法和私有方法,前者与类型有关系,后者不可以被继承或者重写,因为在编译器 我们调用一个类的方法我们不知道具体的调用是是否子类的方法。
- invokestatic,调用静态方法
- invoekspecial 调用实例构造器方法(构造器方法不是构造函数 该方法会执行实例变量和代码块),私有方法和父类方法
- invokevirtual 调用所有的虚方法
- invokeinterface 调用接口方法,会在运行时候在确定一个实习此接口的对象
- 只要是invokestatic,invoekspecial 指令调用的方法都是可以在类加载阶段解析为直接引用,这些方法都可以称之为非虚方法,其他方法除了 final 都可以成为虚方法
- final方法虽然是通过invokevirtual指令调用,但是其只有一个版本 所以是非虚的
分派
- 分派调用有可能是静态的也可能是动态的
- 分派与java 多态有关
静态分派(重载)
- 如果我们有类Class其有重载的时候有三个方法 参数分别是父类A,子类B 子类C,那么我们传递一个A a=new B(); 给这个方法 他会调用参数是父类A
- 即静态分派只会关注形参,我们的A是静态类型,B是实际类型,jvm在编译器就把A参数版本的符号引用写到指令中
- 重载并不是固定的 只是选择最合适的 当我们的参数变化时候,参数类型匹配会进行不断的选择
动态分派(重写)
- 如果我们有父类A,子类B 子类C,执行代码A a1=new B(); A a2=new C();那我们分别调用a1.方法和a2的方法 这个方法都在子类重写了,那么其会调用b,c重写的方法
虚拟机实现动态分配的原理
-
为类在方法区建立一个虚方法表(vtable),与此对应的是我们调用接口的时候也会在字节码指令invokeinterface执行时用到接口方法表(itable)
经典的图如下:
微信截图_20181123132331.png - 上图 如果某个方法在子类中没有重写了,那么子类该方法的地址入口和父类的一致,如果重新了,则子类的方法入口地址会被更改
- 上图中son重写了father的所有方法,所以其方法都知晓子类的实例
- 但是他们都没有重写object的方法 所以object方法都指向object实例
- 为了程序实现上的方便,具有相同签名的方法在父类和子类的虚方法表中都具有意义的索引号,这样类型变化的时候仅仅需要更换查找的方法表
- 虚拟机还有可能使用内联缓存和基于继承关系分析技术的守护内联进行优化
基于栈的字节码解释执行引擎
- 虚拟机执行代码有两种方式,解释执行或者编译执行
解释执行
-
当出现及时编译器之后,class文件到底是会被解释执行还是编译执行。
下图是两种执行方式的图
编译过程.png 指令流基本上是基于栈的指令集架构。指令流里面大部分都是零地址指令,他们一来操作数进栈进行工作
基于寄存器的指令集与基于栈的指令集刚好相对
计算1+1,基于栈的指令集回收iconst_1(把两个常量压入栈),iconst_1,iadd,(把栈顶的两个值出栈相加)istore_0(把栈顶的值放到局部变量表的第0个slot)
基于寄存器的指令集就是 move eax, 1 add eax, 1.move指令把eax设置为1 ,add再给这个指令加1
基于栈的优点就是可移植性但是速度慢,基于寄存器的容易被硬件约束 但是速度快
bipush_100 将单字节的整形常量(100)推入操作数栈顶
istore_1 将操作数栈顶的数据存到第一个局部变量slot
iload_1 从局部变量表中的第一个slot获取数据压入栈顶
iadd把操作数栈顶的2位数弹出相加
-
ireturn把操作数栈顶返回值返回给此方法的调用者
0.png