Jvm体系结构
jvm主要由四部分构成:
1.类加载器
2.执行引擎
- jvm的执行引擎是jvm的核心部分,它的作用就是解析jvm字节码指令,得到执行结果。
- jvm解析字节码的过程可以实现多样化:直接解释、转成本地代码再执行、采用寄存器芯片模式执行
- sun的hotspot是基于栈的执行引擎,google的dalvik是基于寄存器的执行引擎
- 内存区
- 方法区、java堆、java栈、pc寄存器、本地方法区
- 本地方法调用
- 调用c或c++库实现
java栈:每启动一个线程,jvm就为该线程创建一个java栈,同时为该线程分配一个pc寄存器,同时pc寄存器指向该线程的第一行可执行的代码(字节码)
java堆、方法区:存放相关常量
内存管理
java中使用内存的组件:
- java堆:用于存储java对象,堆的大小是在jvm启动时向操作系统一次性申请的内存(大小固定,不能扩展,也不能回收)。可以通过“-Xmx(最大内存),-Xms(最小内存)”。空间释放由GC控制,对象的创建由java程序控制
- 线程:java程序没启动一个线程,jvm会为其创建一个堆栈(一般为256kb-756kb之间,大小根据jvm的实现方式而定)
- 类和类加载器:Sun JDK中被存储在堆中,该区域被称为“永久代(PermGen区)”
永久代被回收的条件:
- 在java堆中,没有对表示该“类加载器”的java.lang.ClassLoader对象的引用
- java堆没有对表示“类加载器”加载的类的任何java.lang.Class对象的引用
- 在java堆中,该“类加载器”加载的任何类的所有对象都不再存活(被引用)
jvm中创建的3个默认的类加载器Bootstrap ClassLoader、ExtClassLoader、AppClassLoader都不满足以上条件,因此任何系统类(如java.lang.String)或通过应用程序“类加载器”加载的任何应用程序类都不能在运行时释放。
- NIO(引入通道和缓冲区来执行I/O),使用java.nio.ByteBuffer.allocateDirect()方法分配内存(本机内存)
- JNI使得本机代码(如C语言)可以调用Java方法,即native memory
JVM内存结构(JVM运行时数据划分):
- PC寄存器数据
- 用于保存当前正常执行的程序的内存地址,因为java程序是多线程执行的。在多线程交叉执行时,记录并保存中断线程当前执行到哪条的内存地址,以便在恢复时中断的指令正常执行。
- Java栈
- java栈总是与线程所关联,每当创建一个线程,JVM就会为该线程创建一个对应的Java栈,每个线程的java栈相互隔离;
- java栈中包含多个栈帧(frames),栈帧与方法相关,每个方法创建一个栈帧,栈帧包含方法内定义的变量、操作栈和方法返回值等信息;
- 栈帧在方法执行完成后弹出栈帧元素作为返回值,并清除栈帧;
- java栈的栈顶的栈帧就是当前正在执行的活动栈(即当前正在执行的方法),PC寄存器指向的是活动栈的地址
- 堆
- 堆是java对象存储的地方,是JVM管理java对象的核心存储区域;
- java堆被java线程共享(同步问题的核心关注点)
- 方法区
- JVM用于存储类结构的地方;
- class文件被加载到JVM时,会被存储到不同的数据结构。其中常量池、域、方法数据、方法体、构造函数、以及类中的专有方法、实例初始化、接口初始化都存储在这个区域
- 方法区属于java堆中的永久区,被线程共享,并且大小可以根据参数来设置
- GC回收器管理java堆的内存释放,方法区虽然比较稳定,但是任然被GC所管理,需要很长时间才能到达Old区
- 本地方法区(本地方法栈)
- JVM运行Native方法准备的空间,与java栈类似。又称为C栈(因为很多Native方法是有C语言实现的)
- JVM运用JIT技术将java方法重新编译为Native Code代码,本地方法栈用来跟踪方法的执行状态
- 运行时常量池
- 数据结构定义:Runtime constant pool代表运行时每个class文件中的常量表,包含:编译期的数字常量、方法或者域的引用(在运行时解析)
- 运行时常量池是方法区的一部分,所有它的存储受方法区的规范约束
JVM内存分配:
- 静态内存分配
在编译时就能确认需要的内存大小 - 栈内存分配
可以成为动态内存分配,只有在运行时才能确定内存的大小
基于堆栈的方法实现 - 堆内存分配
只有在运行时,并且运行到相应代码是才能确定内存的大小
最灵活的内存分配,但是对系统和内存管理是一种挑战
Hotspot基于分代的垃圾回收算法
把对象按照寿命分组,分为年轻代和老年代,新创建的对象被分为年轻代,如果对象经历过几次垃圾回收后仍然存活,那么就把该对象划分到老年代。
分区划分:
- young区
Eden区:存放新创建的对象的区域
Survivor区(两个):当Eden区满后,促发minor GC操作将Eden区存活的对象复制到其中一个Survivor区,另外一个Survivor区存活的对象也复制到该Survivor区中。保证一个Survivor区始终为空 - old区
存放young区中在Survivor区满,并促发minor GC后仍然存活的对象。
如果old区满了之后,促发full GC回收整个堆的内存 - perm区
主要存放累的class对象,如果一个类被频繁的加载,也可能导致perm区满。
perm区垃圾回收也是由Full GC触发
垃圾回收算法
- Serial Collector
- client模式下默认的GC算法
- 指定参数:-XX:+UseSerialGC
- 回收策略:minor GC触发之前检查每次minor GC晋升到Old区的对象平均大小是否超过了old区剩余的空间,如果超过,则促发full GC
- 单线程回收
- 适合有限的情况下,回收慢
- parallel Collector
- 效率高,但是在Heap过大时,应用程序暂停时间较长
- 根据minor GC和full GC不同,分为:
- ParNewGC
- 指定参数:-XX:UseParNewGC
- 回收策略与Serial Collector类似
- 并行回收
- ParallelGC
- Service模式默认GC方式
- 指定参数:-XX:UseParallelGC
- 并行回收:线程个数与CPU和核数有关,可以使用参数“-XX:ParallelGCThreads”来指定
- 回收策略:向Eden区申请内存空间时,如果Eden区空间不够,那么判断申请的空间是否大于Eden空间的一半。如果大于,则申请的空间直接在Old区分配;如果小于,则直接促发minor GC,在促发minor GC之前,检查每次晋升到Old区的平均大小是否大于old区的剩余空间,如果大于,则促发full GC。在此次GC之后仍然会按照该规则再检查一次。
- 清空整个Heap堆中的垃圾对象,清除perm区中已经被卸载的类信息,并进行压缩。
- ParallelOldGC
- 指定参数:-XX:UseParallelOldGC
- 并行回收:线程个数与CPU和核数有关,可以使用参数“-XX:ParallelGCThreads”来指定
- 清除Heap堆中的部分垃圾对象,并进行部分的空间压缩
- CMS Collector
- Old区回收暂停时间短,但是产生内存碎片、整个GC耗时较长、比较耗CPU
- 指定参数:-XX:UseConcMarkSweepGC
- 并行回收:默认线程数为4,可以通过ParallelCMSThreads来指定
- 回收策略:既不是minor GC也不是full GC。促发规则是检查Old区或者perm区的使用率,达到一定比例是促发CMS GC。促发是回收Old区的内存空间,默认是92%