我们知道java语言是跨平台的,一处编译,到处运行。一处编译就是将java文件编译成.class字节码文件。
只要编译的字节码文件符合jvm的规范,那么就可以在java虚拟机上运行,这也说明了它的语言无关性。
那么什么是JVM?
JVM是Java Virtual Machine(Java虚拟机)的缩写,是一个虚构出来的计算机,是通过在实际的计算机上仿真模拟各种计算机功能来实现的。Java虚拟机主要由字节码指令集、寄存器、栈、垃圾回收堆和存储方法域等构成。 JVM屏蔽了与具体操作系统平台相关的信息,使Java程序只需生成在Java虚拟机上运行的目标代码(字节码),就可以在多种平台上不加修改地运行。JVM在执行字节码时,实际上最终还是把字节码解释成具体平台上的机器指令执行。
JVM的生命周期
JVM伴随Java程序的开始而开始,程序的结束而停止。一个Java程序会开启一个JVM进程,一台计算机上可以运行多个程序,也就可以运行多个JVM进程。
要先了解JVM内存模型,
首先要理解class文件的基本结构
文件以CA FE BA BE开始,后面紧跟的是minor version小版本号,major version大版本号,
constant_poop_count常量池数量,后面紧跟的就是常量池内容
access flags代表的是位运算
this_class、super class是class的信息
interface count是接口数量
interfaces是相关接口的信息
field_count是属性数量
fields是属性信息
methods_count是方法数量
method_info是相关方法信息
attribute_count是属性数量
attribute是相关属性信息(包含预定义属性,也可以是自定义信息)
其次总体把握JVM的运行原理,如图
程序计数器(线程私有):
是当前线程锁执行字节码的行号计时器,每条线程都有一个独立的程序计数器,这类内存也称为“线程私有”的内存。正在执行java方法的话,计数器记录的是虚拟机字节码指令的地址(当前指令的地址)。如果是Native方法,则为空。
java 虚拟机栈(线程私有)
也是线程私有的。
每个方法在执行的时候也会创建一个栈帧,存储了局部变量,操作数,动态链接,方法返回地址。
每个方法从调用到执行完毕,对应一个栈帧在虚拟机栈中的入栈和出栈。
通常所说的栈,一般是指在虚拟机栈中的局部变量部分。
局部变量所需内存在编译期间完成分配,
如果线程请求的栈深度大于虚拟机所允许的深度,则StackOverflowError。
如果虚拟机栈可以动态扩展,扩展到无法申请足够的内存,则OutOfMemoryError。
本地方法栈(线程私有)
和虚拟机栈类似,主要为虚拟机使用到的Native方法服务。也会抛出StackOverflowError 和OutOfMemoryError。
Java堆(线程共享)
被所有线程共享的一块内存区域,在虚拟机启动的时候创建,用于存放对象实例。
对可以按照可扩展来实现(通过-Xmx 和-Xms 来控制)
当队中没有内存可分配给实例,也无法再扩展时,则抛出OutOfMemoryError异常。
堆内存可以分为两个部分:年轻代和老年代。下图中的Perm代表的是永久代,但是注意永久代并不属于堆内存中的一部分,同时jdk1.8之后永久代也将被移除。
方法区(线程共享)
被所有方法线程共享的一块内存区域。
用于存储已经被虚拟机加载的类信息,常量,静态变量等。
这个区域的内存回收目标主要针对常量池的回收和堆类型的卸载。
对象的创建过程
1.classloading
2.classlinking(verification,preparation,resolution)
verification:验证
preparation:准备,静态变量赋默认值
resolution:解析
3.classinitializing:初始化;静态变量赋初始值,执行静态代码块
4.申请对象内存
5.成员变量赋默认值
6.调用构造方法(init)
a.成员变量顺序赋初始值
b.执行构造方法语句:先调用super()
一个完整对象包含:对象头,对象体和对齐字节
其中对象头包含的内容
可以看到存放分代年龄是4bit,所以1.8默认的PS+PO垃圾回收器,默认的分代年龄最大是15,即是由此而来
既然说到GC,垃圾回收器
那么什么是垃圾?
没有任何一个引用指向的一个或多个对象(循环引用)
如何定位垃圾?
引用计数法(ReferenceCount)
根可达算法(RootSearching)
常见的垃圾回收算法
标记清除(mark sweep)--位置不连续,产生碎片,效率偏低(两遍扫描)
拷贝算法(copying)--没有碎片,浪费空间
标记压缩(mark compact)--没有碎片,效率偏低(两遍扫描,指针需要调整)
JVM内存分代模型(用于分代垃圾回收算法)
常见的垃圾回收器
- JDK诞生 Serial追随 提高效率,诞生了PS,为了配合CMS,诞生了PN,CMS是1.4版本后期引入,CMS是里程碑式的GC,它开启了并发回收的过程,
但是CMS毛病较多,因此目前任何一个JDK版本默认是CMS 并发垃圾回收是因为无法忍受STW
Serial 年轻代 串行回收
PS 年轻代 并行回收
ParNew 年轻代 配合CMS的并行回收
SerialOld
ParallelOld
ConcurrentMarkSweep 老年代 并发的, 垃圾回收和应用程序同时运行,降低STW的时间(200ms) CMS问题比较多,所以现在没有一个版本默认是CMS,只能手工指定 CMS既然是MarkSweep,就一定会有碎片化的问题,碎片到达一定程度,CMS的老年代分配对象分配不下的时候,使用SerialOld 进行老年代回收
想象一下:
PS + PO -> 加内存 换垃圾回收器 -> PN + CMS + SerialOld(几个小时 - 几天的STW)
几十个G的内存,单线程回收 -> G1 + FGC 几十个G -> 上T内存的服务器 ZGC
算法:三色标记 + Incremental Update
- G1(10ms)
算法:三色标记 + SATB
- ZGC (1ms) PK C++
算法:ColoredPointers + LoadBarrier
- Shenandoah
算法:ColoredPointers + WriteBarrier
Eplison:调试用的多
-
垃圾收集器跟内存大小的关系
Serial 几十兆
PS 上百兆 - 几个G
CMS - 20G
G1 - 上百G
ZGC - 4T - 16T(JDK13)
常见垃圾回收器组合参数设定(JDK 1.8)
- -XX:+UseSerialGC = Serial New (DefNew) + Serial Old
- 小型程序。默认情况下不会是这种选项,HotSpot会根据计算及配置和JDK版本自动选择收集器
- -XX:+UseParNewGC = ParNew + SerialOld
- 这个组合已经很少用(在某些版本中已经废弃)
- -XX:+UseConc (urrent)MarkSweepGC = ParNew + CMS + Serial Old
- -XX:+UseParallelGC = Parallel Scavenge + Parallel Old (1.8默认) 【PS + SerialOld】
- -XX:+UseParallelOldGC = Parallel Scavenge + Parallel Old
- -XX:+UseG1GC = G1
- Linux中没找到默认GC的查看方法,而windows中会打印UseParallelGC
- java +XX:+PrintCommandLineFlags -version
- 通过GC的日志来分辨
- Linux下1.8版本默认的垃圾回收器到底是什么?
- 1.8.0_181 默认(看不出来)Copy MarkCompact
- 1.8.0_222 默认 PS + PO
调优前的基础概念
1.吞吐量:
用户代码时间 / (用户代码时间+垃圾回收时间)
2.响应时间:
STW越短,响应时间越好
所谓调优
首先确定追求啥?吞吐量优先,还是响应时间优先?还是在满足一定的响应时间的情况下,要求达到多大的吞吐量...
什么是调优?
1.根据需求进行JVM规划和预调优
2.优化运行JVM运行环境(慢,卡顿)
3.解决JVM运行过程中出现的各种问题(OOM)
到此为止,如果都理解,那么JVM应该是可以简单入门了,至于更详细的执行原理,不同垃圾回收器的垃圾回收算法等等,请听下回分解咯O(∩_∩)O