1. Java运行时数据区域
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域。根据虚拟机规范规定,主要分为以下几个运行时数据区域:
- 程序计数器
- 虚拟机栈
- 本地方法栈
- 堆
- 方法区
其中方法区和堆是所有线程共享的数据区,其他几个则是线程隔离的数据区。
1.1 程序计数器
程序计数器是一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器。在虚拟机的概念模型里,字节码解释器工作时就是通过这个计数器的值来选取下一条需要执行的字节码指令,分支、循环、跳转、异常处理、线程恢复等都需要依赖这个计数器来完成。
由于Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现的,在任何一个确定的时刻,一个处理器(对于多核来说是一个内核)只会执行一条线程中的指令。因此,为了确保线程切换后能恢复到正确的执行位置,每个线程都需要有一个独立的程序计数器,各个线程之间的计数器互不影响,独立存储,我们称这类内存区域为"线程私有"的内存。
如果线程正在执行的是一个Java方法,这个计数器纪录的是正在执行的虚拟机字节码指令的地址;如果正在执行Native方法,这个计数器值则为空。此内存区域是唯一一个在Java虚拟机规范中没有规定任何OutOfMemoryError情况的区域。
1.2 Java虚拟机栈
与程序计数器一样,Java虚拟机栈也是线程私有,它的生命周期与线程相同。虚拟机栈描述的是Java方法执行的内存模型:每个方法执行的时候都会创建一个栈帧(Stack Frame)用于存储局部变量表、操作栈、动态链接、方法出口等信息。每一个方法被调用直到被执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
局部变量表存放了编译期可知的各种数据类型(boolean、byte、char、short、int、float、long、double)、对象引用(reference类型,它不等同于对象本身,根据不同的虚拟机实现)和returnAddress类型(指向了下一条字节码指令的地址)。
其中64位的long和double类型的数据会占用2个局部变量空间,其余的数据类型只占据一个。局部变量表所需要的内存空间在编译器间完成分配,当进入一个方法时,这个方法需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量的大小。在Java虚拟机规范中,对这个区域规定了两种异常:如果线程请求的栈深度大于虚拟机所允许的深度,则抛出StackOverflowError异常;如果虚拟机栈可以动态扩展,当扩展无法申请到足够的内存时会抛出OutOfMemoryError异常。
1.3 本地方法栈
本地方法栈与虚拟机栈所发挥的作用是非常相似的,区别是虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈为虚拟机使用到的Native方法服务。本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
1.4 Java堆
对于大多数应用来说,Java堆(Java Heap)是Java虚拟机所管理的内存中最大的一块。Java堆是被所有线程共享的一块内存区域,在虚拟机启动时创建。此区域的唯一目的就是存放对象实例,几乎所有的对象实例都在这里分配。
Java堆是垃圾回收器管理的主要区域。
根据Java虚拟机的规范,Java堆可以处理物理上不连续的内存空间中,只有逻辑上是连续的就可以。如果在堆中没有内存完成实例分配,并且堆也无法扩展时,将会抛出OutOfMemoryError异常。
1.5 方法区
方法区与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据。
根据虚拟机规范,方法区如果无法满足内存分配,将会产生OutOfMemoryError异常。
1.6 运行时常量池
运行时常量池是方法区的一部分。自然也会受到方法区的内存限制,当常量池无法再申请到内存时会抛出OutOfMemoryError异常。
运行时常量池用于存放编译期产生的各种字面量和符号引用。
1.7 直接内存
直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域,但是这部分内存也被频繁地使用,而且也可能导致OutOfMemoryError异常出现。
2. 对象访问
以Object obj = new Object()
来讲:
Object obj
将会反应到Java虚拟机栈的本地变量表中,作为一个reference类型数据出现。
new Object()
将会反应到Java堆中,形成了一块存储了Object类型所有实例数据值(Instance Data,对象中各个实例字段的数据)的结构化内存。另外Java堆中还必须包含能查到此对象类型数据(如对象类型、父类、实现的接口、方法等)的地址信息,这些类型数据则存在方法区。
主流的对象访问方式有两种:使用句柄和直接指针。
- 使用句柄
Java堆中将会划分出来一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中则包含了对象实例数据和类型数据各自的具体地址信息。 - 直接指针
reference中直接存储的就是对象地址(即直接指向Java堆中的对象实例),对象实例的对象头存放对象类型指针。
这两种对象的访问方式各有优势,使用句柄访问的最大好处就是reference中存储的是稳定的句柄地址,在对象被移动(GC回收会移动)时只会改变句柄中的示例数据指针,而reference本身不需要被修改。
使用直接指针访问方式最大好处就是速度更快,节省了一次指针定位的时间开销。