Java内存模型
Java内存模型,就是Java程序运行时的内存模型。而Java代码是在Java虚拟机上运行的,由Java虚拟机解释执行(解释器)或者编译执行(即使编译器,JIT)来完成。所以Java内存模型也就是Java虚拟机的运行时内存模型。
Java解释器,可以在任何移植了解释器的机器上执行Java字节码(.class)。即使编译器,Java程序运行时动态地将字节码翻译成特定CPU的机器码。而编译指的是.java文件javac成.class文件。
Java内存模型结构
C/C++程序猿需要时刻注意内存的释放,而Java全权交给虚拟机来处理内存。虚拟机有垃圾回收(GC),会去自动进行垃圾回收。那么都是自动的,好学什么?其实虚拟机自动回收垃圾有一套自己的规律,并不能根据程序猿编写的代码随时GC,所以只能根据垃圾回收的规律,合理安排内存,这就要求我们必须彻底了解JVM的内存管理机制。
运行时内存模型,分为线程私有和共享数据区两大类。
线程私有
线程私有的数据区包含程序计数器、虚拟机栈、本地方法区。
程序计数器
作用:当JVM解释字节码文件时,存储当前线程所执行的字节码行号。所以每一个线程都有一个程序计数器。
Java程序执行时,是依靠Java虚拟机的解释器通过改变当前线程程序计数器的值来按照流程执行指令。当然还有一个好处体现在多线程方面。一个内核同一时间只能执行一条指令,多线程的工作是依靠线程轮流切换(占用CPU时间)来达到的。对于每一个线程来说,必须有一个地方存储中断时的地址(行号),才能保证切回来时回到正确地址。Java规范没有规定该内存区域OOM(OutOfMemoryError)异常。
注意,上面说的指令指的是Java方法,执行native方法时,程序计数器为空。
Java虚拟机栈
虚拟机栈也是线程私有的,其生命周期和线程一样。
虚拟机栈描述的是Java方法执行的内存模型:每个方法(不包括native方法)在执行时都会创建一个栈帧,用于存储局部变量,操作数栈,动态链接,方法出口等信息。每一个方法从调用到执行结束的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程。
在Java虚拟机规范中,对该区域内存规定了两种异常状况:
- StackOverFlowError:当线程请求栈深度超出虚拟机栈所允许的深度时抛出
- OutOfMemoryError:当Java虚拟机动态扩展到无法申请足够内存时抛出
栈帧
栈帧(Stack Frame)是用于支持虚拟机进行方法调用和方法执行的数据结构,它是虚拟机运行时数据区的虚拟机栈(Virtual Machine Stack)的栈元素。
在编译代码的时候,栈帧中需要多大的局部变量表,多深的操作数栈都已经完全确定了,并且写入到了方法表的Code属性中,因此一个栈帧需要分配多少内存,不会受到程序运行期变量数据的影响,而仅仅取决于具体虚拟机的实现。
对于执行引擎来讲,活动线程中,只有虚拟机栈顶的栈帧才是有效的,称为当前栈帧(Current Stack Frame),这个栈帧所关联的方法称为当前方法(Current Method)。执行引用所运行的所有字节码指令都只针对当前栈帧进行操作。
栈帧包括以下内容:
- 局部变量表,是一组变量值存储空间,用于存放方法参数和方法内部定义的局部变量。其大小以slot为最小单位(32位)。在Java程序编译为Class文件时,就在方法表的Code属性的max_locals数据项中确定了该方法需要分配的最大局部变量表的容量。它存放了编译期可知的各种基本数据类型(boolean,byte,char,short,int,float,long,double),对象引用,以及returnAddress类型(指向了一条字节码指令地址)
- 操作数栈,操作数栈也常被称为操作栈,它是一个后入先出栈。同局部变量表一样,操作数栈的最大深度也是编译的时候被写入到方法表的Code属性的max_stacks数据项中。
- 动态链接,每个栈帧都包含一个指向运行时常量池中该栈帧所属性方法的引用,持有这个引用是为了支持方法调用过程中的动态连接。在Class文件的常量池中存有大量的符号引用,字节码中的方法调用指令就以常量池中指向方法的符号引用为参数。这些符号引用一部分会在类加载阶段或第一次使用的时候转化为直接引用,这种转化称为静态解析。另外一部分将在每一次的运行期期间转化为直接引用,这部分称为动态连接。
- 方法返回地址,当一个方法被执行后,有两种方式退出。
- 执行引擎遇到任意一个方法返回的字节码指令,这时候可能会有返回值传递给上层的方法调用者(调用当前方法的的方法称为调用者)。是否有返回值和返回值的类型将根据遇到何种方法返回指令来决定,这种退出方法方式称为正常完成出口(Normal Method Invocation Completion)。
- 在方法执行过程中遇到了异常,并且这个异常没有在方法体内得到处理。只要该异常在本方法的异常表中没有搜索到匹配的异常处理器,就会导致方法退出,这种退出方式称为异常完成出口(Abrupt Method Invocation Completion)。一个方法使用异常完成出口的方式退出,是不会给它的调用都产生任何返回值的。
- 附加信息,虚拟机规范允许具体的虚拟机实现增加一些规范里没有描述的信息到栈帧中,例如与高度相关的信息,这部分信息完全取决于具体的虚拟机实现。在实际开发中,一般会把动态连接,方法返回地址与其它附加信息全部归为一类,称为栈帧信息。
执行引擎,Java虚拟机的执行引擎在执行代码时,都有解释执行(通过解释器执行)和编译执行(通过JIT产生本地代码(特定CPU机器码)执行)两种选择。
以上内容参考自深入理解Java虚拟机笔记---运行时栈帧结构,只是做到了了解栈帧的结构。
日常开发中,经常把内存模型分为堆和栈,而其中的栈其实就是虚拟机栈,更准确的说是虚拟机栈中栈帧的局部变量表。
本地方法栈
本地方法栈则为虚拟机使用到的Native方法提供内存空间。有些虚拟机的实现直接把本地方法栈和虚拟机栈合二为一,比如非常典型的Sun HotSpot虚拟机。
和虚拟机栈一样,本地方法栈区域也会抛出StackOverflowError和OutOfMemoryError异常。
共享数据区
所有线程共享的数据区包含Java堆、方法区,在方法区内有一个常量池。
堆内存
Java堆是Java虚拟机所管理的内存中最大的一块。在虚拟机启动时创建。此内存唯一的目的就是存放对象实例,几乎所有的对象实例都在这里分配内存(随着JIT的发展,有一部分对象实例会放在栈内存)。
Java堆事垃圾收集器管理的主要区域,又称其为"GC堆"(Garbage Collection Heap)。
- 从内存回收的角度来看,Java堆可以细分为新生代和老年代(旧生代)。
- 从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区。
进一步划分的目的是为了更好的回收内存。
在32位系统上最大为2G,64位系统上无限制。可通过-Xms和-Xmx控制,-Xms为JVM启动时申请的最小Heap内存,-Xmx为JVM可申请的最大Heap内存。
如果堆中没有内存完成实例分配,并且堆也无法再扩展时,将会抛出OutOfMemoryError异常。
方法区
它主要存放一杯虚拟机加载的类信息,常量,静态变量,即使编译器后的代码等数据。根据Java虚拟机规范的规定,当方法区无法满足内存分配需求时,将抛出OutOfMemoryError异常。
运行时常量池
运行时常量区是方法区的一部分。用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放。还会有一些符号引用转换的直接引用一保存在运行时常量池中。
运行时常量池具备动态性,也就是运行期间也可以将新的常量放入池中,例如String.intern()方法。
当常量池无法再申请到内存时,会抛出OutOfMemoryError异常。
直接内存
上面描述的内存模型是运行时的数据区。而直接内存并不是虚拟机运行时数据区的一部分,也不是Java虚拟机规范中定义的内存区域。这部分区域也会导致OutOfMemoryError异常出现。
在JDK1.4中新加入类NIO类,引入了一种基于通道与缓冲区的I/O方式,它可以使用Native函数库直接分配堆外内存。它可以使用Native函数库直接分配堆外内存。
由于它是本机内存(Ram),肯定会受到本机总内存大小以及处理器寻址空间的限制。所以在动态扩展时会出现OOM异常。
杂记
变量的初始化
变量根据作用域分有局部变量和类变量。局部变量不像类变量那样存在“准备阶段”。类变量有两次赋初始值的过程,一次在准备阶段,赋予系统初始值;另外一次在初始化阶段,赋予程序员定义的值。因此即使在初始化阶段程序员没有为类变量赋值也没有关系,类变量仍然具有一个确定的初始值。但局部变量就不一样了,如果一个局部变量定义了但没有赋初始值是不能使用的。
字面量,常量,直接量,符号引用类型
- 字面量:与Java语言层面的常量概念相近,包含文本字符串、声明为final的常量值等。还包含了基本数据类型的直接量,以及引用类型的空指向。
- 符号引用:编译语言层面的概念,包括以下3类:
- 类和接口的全限定名
- 字段的名称和描述符
- 方法的名称和描述符
直接量,指在程序中直接出线的常量值。
遗留问题
只有程序计数器内存区域不会抛出OOM异常,其它能够抛出OOM异常的内存区域,都有动态扩展这一特性。