1. 运行时数据区域
Java虚拟机在执行Java程序的过程中会把它所管理的内存划分为若干个不同的数据区域,如图:
程序计数器:一块较小的内存空间,它可以看作是当前线程所执行的字节码的行号指示器,Java虚拟机的多线程是通过线程轮流切换并分配处理器执行时间的方式来实现,在任何一个确定的时刻,一个处理器(对于多核处理器来说是一个内核)都只会执行一条线程中的指令。因此,为了线程切换后能恢复到正确的执行位置,每条线程都需要有一个独立的程序计数器(如果正在执行的是Native方法,这个计数器值则为空)
Java虚拟机栈:线程私有的,它的生命周期与线程相同,是Java方法执行的内存模型:每个方法在执行的同时都会创建一个栈帧(Stack Frame)[插图]用于存储局部变量表、操作数栈、动态链接、方法出口等信息。每一个方法从调用直至执行完成的过程,就对应着一个栈帧在虚拟机栈中入栈到出栈的过程
(一) 局部变量表存放了编译期可知的各种基本数据类型、对象引用、returnAddress类型,局部变量表所需的内存空间在编译期间完成分配,需要在帧中分配多大的局部变量空间是完全确定的,在方法运行期间不会改变局部变量表的大小
本地方法栈:(Native Method Stack)与虚拟机栈所发挥的作用是非常相似,虚拟机栈为虚拟机执行Java方法(也就是字节码)服务,而本地方法栈则为虚拟机使用到的Native方法服务
Java堆:被所有线程共享的一块内存区域,在虚拟机启动时创建。此内存区域的唯一目的就是存放对象实例,从内存回收的角度来看,由于现在收集器基本都采用分代收集算法,所以Java堆中还可以细分为:新生代和老年代;再细致一点的有Eden空间、From Survivor空间、To Survivor空间等。从内存分配的角度来看,线程共享的Java堆中可能划分出多个线程私有的分配缓冲区(Thread Local Allocation Buffer,TLAB)
方法区:(Method Area)又叫做永久代,与Java堆一样,是各个线程共享的内存区域,它用于存储已被虚拟机加载的类信息、常量、静态变量、即时编译器编译后的代码等数据,运行时常量池(Runtime Constant Pool)是方法区的一部分。Class文件中除了有类的版本、字段、方法、接口等描述信息外,还有一项信息是常量池(ConstantPool Table),用于存放编译期生成的各种字面量和符号引用,这部分内容将在类加载后进入方法区的运行时常量池中存放
在jdk1.8正式移除了方法区的概念转变为元空间,移除永久代是为融合HotSpot JVM与 JRockit VM而做出的努力,因为JRockit没有永久代,不需要配置永久代,实际使用中永久代内存也经常不够用或发生内存泄露。移除永久代的工作从JDK1.7就开始了。JDK1.7中,存储在永久代的部分数据就已经转移到了Java Heap或者是 Native Heap。但永久代仍存在于JDK1.7中,并没完全移除,譬如符号引用(Symbols)转移到了native heap;字面量(常量池)转移到了java堆;类的静态变量(class statics)转移到了java堆
元空间:元空间的本质和永久代类似,都是对JVM规范中方法区的实现。不过元空间与永久代之间最大的区别在于:元空间并不在虚拟机中,而是使用本地内存,存储已被虚拟机加载的类信息、即时编译器编译后的代码等数据。总结以下几点元空间替代永久代的原因:(1)字符串存在永久代中,容易出现性能问题和内存溢出(2)类及方法的信息等比较难确定其大小,因此对于永久代的大小指定比较困难,太小容易出现永久代溢出,太大则容易导致老年代溢出(3)永久代会为 GC 带来不必要的复杂度,并且回收效率偏低(4)可能会将HotSpot 与 JRockit 合二为一
2. 对象
对象的内存布局:
对象在内存中存储的布局可以分为3块区域:对象头(Header)、实例数据(Instance Data)和对齐填充(Padding)
对象头:(Mark Word)存储对象自身的运行时数据,如哈希码(HashCode)、GC分代年龄、锁状态标志、线程持有的锁、偏向线程ID、偏向时间戳等
元数据的指针:虚拟机通过这个指针来确定这个对象是哪个类的实例,如果对象是一个Java数组,那在对象头中还必须有一块用于记录数组长度的数据
对齐填充:仅仅起着占位符的作用。由于HotSpot VM的自动内存管理系统要求对象起始地址必须是8字节的整数倍,换句话说,就是对象的大小必须是8字节的整数倍。而对象头部分正好是8字节的倍数,因此,当对象实例数据部分没有对齐时,就需要通过对齐填充来补全
对象的访问定位:主流的访问方式有使用句柄和直接指针两种,(1)句柄访问:Java堆中将会划分出一块内存来作为句柄池,reference中存储的就是对象的句柄地址,而句柄中包含了对象实例数据与类型数据各自的具体地址信息,在对象被移动(垃圾收集时移动对象是非常普遍的行为)时只会改变句柄中的实例数据指针,而reference本身不需要修改(2)直接指针访问:那么Java堆对象的布局中就必须考虑如何放置访问类型数据的相关信息,而reference中存储的直接就是对象地址,速度更快
一个对象NEW创建在jvm内存区域上的分配过程:
(1)类加载检查,首先将去检查这个指令的参数是否能在常量池中定位到一个类的符号引用,并且检查这个符号引用代表的类是否已被加载、解析和初始化过。如果没有,那必须先执行相应的类加载过程
(2)java堆分配对象内存,分配的方式有 指针碰撞 和 空闲列表 两种,选择哪种分配方式由Java堆是否规整决定,而Java堆是否规整又由所采用的垃圾收集器是否带有压缩整理功能决定,内存分配的并发安全 CAS+失败重试 和 TLAB本地线程分配缓冲
指针碰撞:假设Java堆中内存是绝对规整的,所有用过的内存都放在一边,空闲的内存放在另一边,中间放着一个指针作为分界点的指示器,那所分配内存就仅仅是把那个指针向空闲空间那边挪动一段与对象大小相等的距离
空闲列表:Java堆中的内存并不是规整的,已使用的内存和空闲的内存相互交错,虚拟机就必须维护一个列表,记录上哪些内存块是可用的,在分配的时候从列表中找到一块足够大的空间划分给对象实例,并更新列表上的记录
(3)分配到的内存空间初始化为零值
(4)设置对象头,是否启用偏向锁、如何能找到类的元数据信息,对象的哈希码,对象的GC分代年龄信息等
(5)执行对象的init()方法
常见问题:
String类的intern()方法:是一个Native方法,它的作用是如果字符串常量池已经包含一个等于此String对象的字符串,则返回代表池中这个字符串的String对象;否则,将此String对象包含的字符串添加到常量池中,并且返回此String对象的引用
JDK1.6 intern()方法会把首次遇到的字符串实例复制到永久代中,返回的也是永久代中这个字符串实例的引用
JDK1.7 intern()方法不会再复制实例,只是在常量池中记录首次出现的实例引用
内存溢出:指程序申请内存时,没有足够的内存供申请者使用
内存泄漏:指程序在申请内存后,无法释放已申请的内存空间,一次内存泄漏似乎不会有大的影响,但内存泄漏堆积后的后果就是内存溢出
线程请求的栈深度大于虚拟机所允许的最大深度,将抛出StackOverflowError异常
虚拟机在扩展栈时无法申请到足够的内存空间,则抛出OutOfMemoryError异常