Java程序在执行前首先会被编译成字节码文件,然后类加载器将字节码文件加载到JVM中,最后由JVM执行这些字节码文件,从而使得Java程序得以执行。JVM内存模型原理图如下所示:
一、线程私有数据区(线程独占区):
线程私有的数据区包括 虚拟机栈(VM stack)、本地方法栈(Native Method Stack)和程序计数器(Program Counter Register)
1. 虚拟机栈
虚拟机栈描述的是Java方法执行的内存模型,是线程私有的。每个方法在执行的时候都会创建一个栈帧,用于存储局部变量表、操作数栈、动态链接、方法出口等信息,而且 每个方法从调用直至完成的过程,对应一个栈帧在虚拟机栈中入栈到出栈的过程。生命周期与线程相同,无线程安全的顾虑,因为都是线程单独私有的。
虚拟机栈有两种异常情况:StackOverflowError 和 OutOfMemoryError。线程栈的大小决定了方法调用的可达深度,若线程请求的栈深度大于虚拟机允许的深度,则抛出 StackOverFlowError 异常。此外,栈的大小可以是固定的,也可以是动态扩展的,-Xss 参数可以设置虚拟机栈大小。若虚拟机栈可以动态扩展(大多数虚拟机都可以),但扩展时无法申请到足够的内存(比如没有足够的内存为一个新创建的线程分配栈空间时),则抛出 OutofMemoryError 异常。下图为栈帧结构图:
局部变量:
局部变量表存放了编译器可知的各种基本数据类型(int、short、byte、char、double、float、long、boolean)、对象引用(reference类型,它不等同于对象本身,可能是一个指向对象起始地址的引用指针,也可能是指向一个代表对象的句柄或其他与此对象相关的位置)和returnAddress类型(指向下一跳字节码指令的地址)
局部变量表所需的内存空间在编译期间完成分配,当进入一个方法时,这个方法需要在栈帧中分配多大的局部变量是完全确定的,在运行期间栈帧不会改变局部变量表的大小空间
操作栈:
一个后进先出(Last-In-First-Out)的操作数栈,也可以称之为表达式栈。方法开始执行时,这个方法的操作数栈是空的。
操作数栈的每个位置上可以保存一个java虚拟机中定义的任意数据类型的值,包括long和double。32位数据类型所占的栈容量为1,64位数据类型所占的栈容量为2。
所需的最大深度在编译期就定义好了,保存在方法的Code属性中,为max_stack的值。
在方法执行过程中,根据字节码指令,往栈中写入数据或提取数据,即入栈(push) /出栈(pop)
借鉴:https://www.cnblogs.com/zhou-yuan/p/14252272.html
动态链接:
运行时常量池中该栈帧所属方法的引用,:描述一个方法调用了另外的其他方法时,就是通过常量池中指向方法的符号引用来表示的,那么动态链接的作用就是为了将这些符号引用转换为调用方法的直接引用。
返回地址:
当方法返回时,有三个操作:
恢复上层方法的局部变量表和操作数栈。
把返回值压入调用者栈帧的操作数栈,异常返回时没有返回值。
调整PC计数器的值以指向方法调用指令后面的一条指令
2. 本地方法栈
与虚拟机栈基本类似,区别在于虚拟机栈为虚拟机执行的java方法服务,而本地方法栈为虚拟机执行 Native 方法服务,普通开发可以忽略。JDK1.8 HotSpot虚拟机直接就把本地方法栈和虚拟机栈合二为一。本地方法栈区域也会抛出 StackOverflowError 和 OutOfMemoryError 异常。
3. 程序计数器
程序计数器是线程私有的一块较小的内存空间,是当前线程所执行的字节码的行号指示器。如果线程正在执行的是一个 Java 方法,计数器记录的是正在执行的字节码指令的地址;如果正在执行的是 Native 方法,则计数器的值为空。这一块区域没有任何 OutOfMemoryError 定义
二、线程共享数据区
线程共享的数据区 具体包括 Java堆 和 方法区 两个区域。
1. Java堆
JVM管理的最大的一块内存区域,存放着对象的实例,是线程共享区。JAVA堆可以处于物理上不连续的内存空间中,只要逻辑上是连续的即可。可通过参数 -Xmx -Xms 来指定运行时堆内存的大小,堆内存空间不足也会抛OutOfMemoryError异常。
堆是垃圾收集器管理的主要区域,因此也被称为“GC堆”。
JAVA堆的分类:
从内存回收的角度上看,可分为新生代(Eden空间,From Survivor空间、To Survivor空间)及老年代(Tenured Gen)。
从内存分配的角度上看,为了解决分配内存时的线程安全性问题,线程共享的JAVA堆中可能划分出多个线程私有的分配缓冲区(TLAB)。
TLAB (Thread Local Allocation Buffer,线程私有分配缓冲区):
虚拟机为新生对象分配内存时,存在可能出现正在给对象A分配内存,指针还未修改,对象B又同时使用原来的指针分配内存的情况(指针用于划分内存使用空间和空闲空间)。TLAB 的存在就是为了解决这个问题:每个线程在Java堆中预先分配一小块内存 TLAB,线程需要分配内存时首先在自己的TLAB上进行分配,若TLAB用完并分配新的TLAB时,再加同步锁定,这样就大大提升了对象内存分配的效率。
2. 方法区
方法区是线程共享的,保存在着被加载过的每一个类的信息(虚拟机加载的类信息(类的版本、字段、方法、接口),常量,静态变量,即时编译器编译后的代码等数据;这些信息由类加载器在加载类的时候,从类的源文件中抽取出来;static变量信息也保存在方法区中。当有多个线程都用到一个类的时候,而这个类还未被加载,则应该只有一个线程去加载类,让其他线程等待。
方法区逻辑上属于堆的一部分,但是为了与堆进行区分,通常又叫“非堆”。
方法区通常和永久区(Perm)关联在一起,但永久代与方法区不是一个概念,只是有的虚拟机用永久代来实现方法区,这样就可以用永久代GC来管理方法区,省去专门内存管理的工作。根据Java虚拟机规范的规定,当方法区无法满足内存分配的需求时,将抛出 OutOfMemoryError 异常。
三、JVM演变
JVM从JDK1.6到1.8的演变过程:
1. 具体变化
1.jdk1.6及之前:有永久代,字符串常量池和静态变量存放在永久代上。
2.jdk1.7:有永久代,但字符串常量池和静态变量移保存在堆中。
3.jdk1.8及之后:无永久代,类信息和运行时常量保存在本地内存的元空间,但字符串常量池和静态变量仍留在堆空间。
2. 演变原因
方法区中原来存放了类信息、字符串常量池、静态变量和运行时常量,受GC的管理,而GC的目标是对这些类型的卸载和常量的回收。但由于这些数据被类的实例引用,卸载条件变得复杂且严格,回收不当会导致堆中的类实例失去元数据信息和常量信息。因此,回收方法区内存不是一件简单高效的事情,往往GC在做无用功。另外随着应用规模的变大,各种框架的引入,尤其是使用了反射,动态代理等字节码生成技术的框架,对于方法区的大小设置无法把控,会导致方法区内存占用越来越大,最终造成OutOfMemoryError。