概述
我们知道Java是一个多平台语言,它实现不依赖于操作系统的秘诀就是JVM,最终我们编写的.java文件都将转换成.class文件运行于JVM之上,JVM在执行Java程序的时候会将用一块空内存来存储程序信息,JVM内部又将这一大块内存划分为多个小块,接下来我们一起来看下JVM是如何划分这一大块内存空间的。
总览
直接上图
可以看到,大致的可以将其分为以下4个区域: 方法区(也叫元数据区),栈(本地方法栈和Java栈可以归为一类),堆,程序计数器
每部分的作用
了解了区域划分之后,再来看每个区域的作用以及他们分别存储了什么东西
1. 堆
先从大家很熟悉的堆开始:堆是Java最主要的内存区域,也是最占用内存的运行区域,同时也是我们优化的最主要区域。
存储着什么?堆中主要存储我们new的对象,更详细的说,“Java中对象与数组的分配在堆上完成的”,同时堆内存是线程共享的,这意味着堆内存是“公用”的。
堆还可以再分?Java是自动管理内存的语言,意味着它可以自动进行垃圾回收,回收工具则是各种垃圾回收器,回收的主要区域就是堆。
部分垃圾回收器(如CMS垃圾回收器)为了提高回收的效率,在逻辑上将堆分为老年代与新生代。新生代顾名思义就是新创建的对象都会在该区域进行分配,当对象经过一段时间未被垃圾收集器回收或者分配内存大小超过参数值或者达到一定的晋升限制(垃圾收集超过一定次数未被回收)后会晋升为老年代。老年代顾名思义就是长期存在的对象所在的区域。新生代又可以分为Eden区,From Survior区与To Survior区,他们默认的比例是8:1:1(这么分的原因是因为新生代一般采用复制算法进行垃圾回收,每次将Eden+From中存活的对象移入To区,并将Eden+From清空。虽然To区很小,但是新生代对象大部分都是new完就死的。当to区对象年龄达到阈值或者没有足够内存空间进行分配则会晋升至老年代)
而另一部分垃圾回收器(如G1,ZGC,已经逐步取代按年代划分的垃圾回收器)则不会按照年代进行划分,而是将整个区域分为各个Region,已Region为单位进行回收。
当堆中对象过多无法得到垃圾回收,并无法为新创建的对象分配内存时,就会发生熟悉的OutOfMemoryError内存溢出异常。
2.栈
栈数据结构的概念大家都比较熟悉,主要特点先进后出,不知道有没有同学做过关于括号算术题的问题(大概就是用栈结构解决带括号的算术问题),他的解法就是遇到左括号入栈,右括号出栈,这个思路其实和JVM栈原理差不多。
和堆不同的是,栈是线程私有的。当线程运行的时候会生成栈结构,每当方法执行的时候,会产生一个栈帧,进行入栈操作,方法退出进行出栈操作。栈帧里存放着方法的局部变量表、方法出口等信息。当你的方法调用层次过深,例如递归没有出口的时候(从前有座山山里有座庙...)将会发生StackOverflow异常。所以递归调用的时候一定要有递归出口。假如栈允许的容量足够大,申请新的栈帧时无法申请到足够的内存,就会发生OutOfMemoryError内存溢出异常。
由总览图可以看到,栈其实可以细分为Java栈和本地方法栈(Native)。Java栈就是正常的Java方法调用栈,本地方法栈则是使用Java调用本地C代码(即Java中的Native方法)时使用的方法栈。使用Native方法的原因是:由于Java属于上层语言,进行一些和底层相关的操作时会有一些效率的问题,所有Native方法一般采用C实现,JavaWeb开发中应用的不多,如果用Java开发Android应用的话这个是必须掌握的(以前学的安卓现在已经忘光了。。)
3. 程序计数器
它不同于普通意义上的计数器(记录次数),它主要用来记录程序运行到什么位置,它保存的是程序当前执行的指令的地址,程序中的跳转操作依赖他来完成,执行程序时从程序计数器中得到指令地址,然后计数器将会得到下一条指令的地址。既然是用来指示程序运行位置的,则必然是线程私有的,否则多线程的情况下就会发生问题(线程切换回来后不能回到该线程的指令位置)。特别需要注意的是这个区域没有OutOfMemoryError内存溢出异常。
4. 方法区(元数据区)
之所以加个括号是因为在JDK1.8之前叫方法区,还有个名字叫永久代(PermGen space ),主要存储已经编译的代码、常量,字符串常量池等信息,它也是线程共享的。
JDK1.8以后使用元数据区取代方法区,取代的原因是除了Hotspot,其他很多虚拟机并没有实现方法区,而且方法区在进行内存回收的过程中还总出bug,导致内存泄露(官网解释,我用蹩脚英语翻译了一下)。和方法区不同的是,他采用的是直接内存分配,存储的内容为之前方法区存储的数据和字符串常量池。
总结
关于JVM还有很多要说的地方,了解内存划分只是其中的基础。以后有机会再来写其他的部分。
参看资料:深入理解Java虚拟机-周志明