JVM是JAVA语言的核心与基础,也是JAVA语言也有的魅力,JVM完成了内存的动态分配与垃圾回收技术,借用周志明的一句话:JAVA与C++等语言之间有一睹由动态内存分配和垃圾回收技术围城的“高墙”,墙外的人想进来,墙里的人想出去。了解JVM对于每一个JAVA程序员来说都是非常有意义的一件事。故笔者计划整理一个JVM系列文章,方便各位读者查阅,同时也非常欢迎各位批评指正共同进步。
本篇属于java虚拟机系列第一篇,本章的主要内容是梳理清楚java运行时内存区域,搞清楚jvm内存的划分以及每个区域的主要存储内容,本系列所说的虚拟机主要围绕Hotspot虚拟机jdk1.7版本,还望各位读者记住这个前提。
内存区域
关于jvm内存区域,首先附上一张图:
内存区域划分
jvm粗粒度的划分可以分为如上图的几个区域:
堆、方法区(包含运行时常量池)、虚拟机栈、本地方法栈、程序计数器
线程角度分类
- 线程共享区域:
堆、方法区 - 线程私有区域:
虚拟机栈、本地方法栈、程序计数器
内存区域详解
- 堆
堆是JAVA程序员最关心也最熟悉的一块空间,是jvm管理的最大的一块内存,在物理要求上也并非一定要连续的内存空间,只要逻辑上连续即可,同时这一块的区域也支持动态扩展,当然你也可以设置初始堆和最大堆的内存空间一样大避免其动态扩展。如上所说这块区域被多个线程所共享,主要存储着对象的实例和数组,当然随着JIT编译器的发展和逃逸分析技术的逐渐成熟,对象在堆上分配也逐渐发生了微妙的变化,对象在堆上分配空间也不再是那么的绝对了,这一点我们在之后的文章中在聊,这一区域也是垃圾回收器主要管理的一部分所以也称为GC堆,从内存回收的角度分析堆内空间又被划分为新生代、老年代,而新生代又被划分为Eden、survivor from 、survivor to三个区域,程序new的对象首先会被分配在新生代中,所以新生代的所占的空应该是比较大的,而这些对象基本上又属于朝生夕灭的所以GC在这一区域又特别的频繁,为了更好的配合GC垃圾回收(这块内存在接下的JVM系列文章中将会讲到)和更好的利用堆内空间,所以这块堆内的空间划分如下图:
如上图所以堆内区域又被划分为新生代、老年代,新生代又被划分为Eden、S0、S1即survivor from 、survivor to,具体的比例按照8:1:1,为什么会是这样的比例划分在接下来的文章中笔者将会一一解释。
堆内存的设置可以通过 -Xms、-Xmx初始堆和最大堆等参数控制,具体虚拟机参数的设置笔者将在接下来JVM参数调优一文中详细解析。当堆内存无法存放新的实例并且也无法扩展的时候将会报出OutOfMemoryError。
-
方法区
方法区也是被线程所共享的一块内存区域,在物理上如同堆要求一样也并非一定要连续的空间,这一块的主要存储内容为被编译器编译后的代码数据,也可以称之为元数据,何为元数据机即类信息、常量、静态变量等,也有很多的同行称方法区为永久代,其实这两者并不完全等价,方法区是JAVA虚拟机规范规定的内存区域,而永久代是HotSpot团队对方法区的实现而已,可以总结为方法去表示标准,而永久代是具体实现,在存储空间上方法区的实现永久代位于堆中间中的一部分,而这只是HotSpot虚拟机的实现,其他的虚拟机中可能并没有永久代这个概念,引入永久代只是HotSpot沿用堆的分代机制,这样可以很好的沿用垃圾回收算法,并不需要专门为方法区在编写垃圾回收算法。也就是说不要误以为方法区的内容就像其名字一样永生,不是这样的,引入永久代只是Hotspot团队沿用堆内存分代的思想,相比较堆内存频繁的GC,方法区的垃圾回收相对来说要少很多,但绝不是说方法区就不会存在垃圾回收,这点还希望各位读者理解,方法区的内容依然会被垃圾回收机制回收,只是判断这部分类的原始数据是否需要回收,相对来说比较苛刻。同样的可以使用-XX:PermSize、-XX:MaxPermSize等参数控制这一部分区域的大小,也同样当这部分空间不能满足内存分配的需要也会报出OutOfMemoryError异常- 运行时常量池
运行时常量池是属于方法区的一部分空间,方法区除了保存类、接口的原始数据版本、字段方法等之外,还保存着在编译期间生成的各种字面量和符号引用,这部分的内存在类加载后将会存储在运行时常量池中,java语言并不要求运行时常量池只存放编译器生成的字面量等,运行期也可能会将新的常量放入池中比如String的intern()方法,就是将运行期生成在堆上的字符串移动至方法区的常量池中,运行时常量池位于方法区,所以当然受到方法区空间的约束,在内存空间不足的情况下同样也会抛出OutOfMemoryError异常。
- 运行时常量池
虚拟机栈
虚拟机栈存储着对象的引用以及方法执行的数据如局部变量、操作数等,这部分空间在编译器就一定确定并不会随着程序的运行而动态扩展,虚拟机栈的生命周期跟随线程的生命周期而生而灭为线程私有的存储空间,每个方法在执行的时候都会创建一个栈帧的概念,在这个栈帧中存储着局部变量、操作数、动态链接、方法出口等信息,每一个方法的执行在虚拟机栈中就对应的一个栈帧的入栈出栈操作。在java虚拟机规范中虚拟机栈可能会存在两种异常StackOverFlowError、OutOfMemoryError,如果线程请求的栈深度大于虚拟机所允许的深度将会报出StackOverFlowError,如果无法申请到足够的内存空间的时候将会报出OutOfMemoryError异常,可以通过参数-Xss控制本地方法栈
本地方法栈的功能和作用类似于虚拟机栈,只不过本地方法栈存储的内容为执行本地方法 的信息,同样这个区域在使用不合理的时候也会存在StackOverFlowError、OutOfMemoryError两种异常,对于本地方法栈JAVA虚拟机规范并没有明确的规定应当使用何种数据结构怎么去实现,不同的虚拟机实现的方法可能不同,比如HotSpot虚拟机就将虚拟机栈和本地方法栈合二为一。程序计数器
程序计数器相对来说是占较小的空间,它可以看做当前线程所执行的字节码的行号指示器,注意只是当前线程的行号指示器,不同的线程会有自己不同 的计数器,所以程序计数器也是线程私有的,在jvm工作的过程中就是通过这个区域取到下一条要执行的指令。如果线程正在执行一个JAVA方法,这个计数器记录是正在执行的虚拟机字节码的指令,而如果线程正在执行Native本地方法,则这个计数器的值为空,这个区域是在JAVA虚拟机规范中唯一一个没有规定抛出OutOfMemoryError异常的区域
方法区细微变化
前面描述的方法区的实现永久代在物理划分上属于堆上的一块空间这是在JDK1.7以前,从实现上7来看永久代的实现并不是一个好主意,因为也存在内存溢出的情况,所以在1.7开始HotSpot团队逐渐抛弃了原来的永久代的实现方式,而是将方法区划分为两部分一部分依然存在堆上比如字符串常量池,还有一部分类的信息等直接使用本地内存成为MetaSpace空间,这是一个方法区实现上细微的变化。
至此我们基本上对JVM内存区域的描述算是完成了,但是这也只是一个浅显的粗略的认识与描述,JVM深层次的设计原理、实现方式还需要进一步去了解,毕竟JAVA的核心也不是一篇两篇能描述的清楚的事情,理解与编写的过程难免存在误解的地方,希望各位高手多多交流指正,大家共同进步,多谢各位!下一章JVM系列02,我们一起来总结垃圾回收算法。