Java 很多不同运行方式，但都离不开JRE ，Java 运行环境。

开发工具运行
双击执行Jar 文件运行
命令行运行
网页中运行

JRE : 包含必要组件，Java虚拟机，Java 核心类库。
JDK ： Java 开发工具包，包含JRE ，附带一系列开发、诊断工具

Java 执行系统主流实现以及设计决策

C++ 可以直接编译成机器码运行，Java为什么还需要虚拟机中运行呢？

Java 是高级程序语言，语法非常复杂，抽象度很高，执行在硬件运行复杂的程序不现实，所以运行之前需要转换

转换设计思路：

设计面向 java 语言特性的虚拟机，并通过编译器将Java 程序转换成该虚拟机能识别的 指令序列。就是Java 字节码。
取名来历：因为Java 字节码指令的操码（opcode）被固定位一个字节。

Java 虚拟机可以由硬件实现，但更多是软件实现，一旦程序被转换成Java 字节码，便可以在不同平台虚拟机里面运行，我们说的一次编写，到处运行。
带来了一个托管环境，能代替我们处理一些代码冗长而且容易出错的部分。
其中当属自动内存管理，与垃圾回收。
除此之外，托管环境还提供诸如数组越界、动态类型、安全权限等动态监测，免于书写这些业务无关的逻辑代码。

Java虚拟机具体怎么运行的java 代码？

以标准JDK 中的 HotSpot 虚拟机为例，从虚拟机以及底层硬件两个角度，讲Java 虚拟机具体是怎么运行Java 字节码的。

虚拟机视角

执行Java 代码，要将它编译而成的Class 文件加载到Java 虚拟机中。
加载后Java 类会存放在方法去（Method Area）中。实际运行时，虚拟机会执行方法区内的代码。
Java 虚拟机在内存中划分出堆和栈来存储运行时的数据。
将栈细分为Java方法的Java方法栈，和面向本地方法（用C++ 写的native）的本地方法栈。
以及存放各个线程执行位置的PC 寄存器。

image.png

运行过程中，每当调用一个Java 方法，Java 虚拟机会在当前线程的Java 方法栈中生成一个栈帧，用以存放局部变量以及字节码操作数。
栈帧大小提前计算好的，虚拟机不要钱栈帧在内存工具里连续分布。
当退出当前执行方法时，不管正常返回还是异常返回，虚拟机均会弹出当前线程的当前栈帧，并将其舍弃。

从硬件视角

Java 字节码无法直接执行，Java 虚拟机需要将字节码翻译成机器码。
在Hotspot 里面，翻译过程有两种形式：
第一种：解释执行，即逐条将字节码翻译成机器码并执行。
第二种：即时编译（Just-In-Time compilation ，JIT），将一个方法中包含的所有字节码贬义词机器码后再执行。

前者优势在于无需等待编译，而后者优势在于实际运行速度更快。

Hotspot 默认采用混合模式，综合解释执行和即时编译的优点。会先解释执行字节码，而后将其中反复执行的热点代码，以方法为单位进行即时编译。

image.png

运行效率如何？

Hotspot 采用了多种技术提升启动性能以及峰值性能，即时编译是其中最重要的技术之一。

即时编译建立在程序符合二八定律的假设上，就是20%代码占据了80%的计算资源。
80%不常用的代码，需要耗费时间将其编译成机器码，采取解释执行方式运行。
理论上即时编译后 Java 程序的执行效率可能超过 c++ 程序的，
因为，与静态编译相比，即时编译拥有程序的运行时信息，并能根据信息作出相应的优化。

举例，虚方法用来实现对象多态性的，一个虚方法调用，尽管很多目标方法，但实际运行过程可能只调用其中一个，这个信息被即时编译利用，来规避虚方法调用开销，从而达到比静态编译的C++ 程序更高的性能。

如何规避的？是把所有目标方法提前全部即时编译?

为了满足不同用户场景需要Hotspot 内置了多个即时编译器，C1 C2 和Graal。
引入多个即时编译器，
为了编译时间和生成代码的执行效率进行取舍。

C1: Client 编译器，面向的是对启动性能有要求的客户端GUI 程序，采用的优化手段相对简单，所以编译时间较短。
C2：Server 编译器，面向的是对峰值性能有要求的服务器端程序，采用的优化手段相对复杂，因此编译时间较长，但同时生成代码的执行效率较高。

Java 7 开始分层编译，热点方法首先C1 编译，然后热点方法中的热点会进一步被C2编译

为了不干扰应用的正常运行，Hotspot即时编译是放在额外的编译线程中进行的。
Hotspot根据CPU 的数量设置编译线程的数目，并且按1:2 的比例配置给 C1 及 C2 编译器。
在计算资源充足的情况下，字节码解释执行和即时编译同时进行，编译完成后机器码会在下次调用该方法时启用，以替换原本的解释执行。

作业：思考Java语言和Java虚拟机看到Boolean类型的方式是否不同。

$ echo '
public class Foo {
 public static void main(String[] args) {
  boolean flag = true;
  if (flag) System.out.println("Hello, Java!");
  if (flag == true) System.out.println("Hello, JVM!");
 }
}' > Foo.java
$ javac Foo.java
$ java Foo
$ java -cp /path/to/asmtools.jar org.openjdk.asmtools.jdis.Main Foo.class > Foo.jasm.1
$ awk 'NR==1,/iconst_1/{sub(/iconst_1/, "iconst_2")} 1' Foo.jasm.1 > Foo.jasm
$ java -cp /path/to/asmtools.jar org.openjdk.asmtools.jasm.Main Foo.jasm
$ java Foo

----------------------- 解释 ----------------------------
jvm把boolean当做int来处理

flag = iconst_1 = true

awk把stackframe中的flag改为iconst_2

if（flag）比较时ifeq指令做是否为零判断，常数2仍为true，打印输出

if（true == flag）比较时if_cmpne做整数比较，iconst_1是否等于flag，比较失败，不再打印输出

精彩评论：

解释执行执行时才翻译成机器指令，无需保存不占内存。但即时编译类似预编译，编译之后的指令需要保存在内存中，这种方式吃内存，按照二八原则这种混合模式最恰当的，热点代码编译之后放入内存避免重复编译，而其他运行次数较少代码则解释执行，避免占用过多内存
为什么不把代码全部编译成机器码？

问得好！事实上JVM确实有考虑做AOT (ahead of time compilation) 这种事情。AOT能够在线下将Java字节码编译成机器码，主要是用来解决启动性能不好的问题。

对于这种发布频率不频繁(也就是长时间运行吧？)的程序，其实选择线下编译和即时编译都一样，因为至多一两个小时后该即时编译的都已经编译完成了。另外，即时编译器因为有程序的运行时信息，优化效果更好，也就是说峰值性能更好。

热点代码区别

看到有人说热点代码的区别，在git里面涉及到的热点代码有两种算法，
基于采样的热点探测和基于计数器的热点探测。
一般采用的都是基于计数器的热点探测，两者的优缺点百度一下就知道了。
基于计数器的热点探测又有两个计数器：
方法调用计数器，回边计数器，他们在C1和C2又有不同的阈值。😂😂

什么时候使用C1，什么时候使用C2，他是怎么区分热点方法的呢？

作者回复: 刚刚看到一个同学总结了。JVM会统计每个方法被调用了多少次，超过多少次，那就是热点方法。(还有个循环回边计数器，用来编译热循环的。)

默认的分层编译应该是达到两千调C1，达到一万五调C2。

栈帧

老师，那个pc寄存器，本地方法栈，以及方法栈，java方法栈这三个组成的就是我们常统称的栈吧，然后也叫栈帧？

作者回复: JVM里的栈指的应该是Java方法栈和本地方法栈。每个方法调用会在栈上划出一块作为栈帧(stack frame)。栈是由多个栈帧构成的，就好比电影是由一个个帧构成的。

为啥是"理论"上比cpp快...这样看起来如果都编译成机器码了应该就是挺快的呀... 那干啥不像Go一样直接编译成目标平台的机器码... 咋感觉绕了一圈..

作者回复: 因为实际上会插入一些虚拟机相关的代码，稍微拉低了运行效率。

至于为什么不采用直接编译的方法，在峰值性能差不多的这个前提下，线下编译和即时编译就是两种选项，各有优缺点。JVM这样做，主要也是看重字节码的可移植性，而牺牲了启动性能。

另外呢，现代工程语言实现都是抄来抄去的。JVM也引入了AOT编译，在线下将Java代码编译成可链接库。

老师，问一下这个asmtools是做什么用的

作者回复: 就是Java字节码的反汇编器和汇编器。

解释执行是将字节码翻译为机器码，JIT也是将字节码翻译为机器码，为什么JIT就比解释执行要快这么多？
如果说JIT检测到是热点代码并且进行优化，那么为什么解释执行不直接就用这种优化去解释字节码？
一些比较浅的问题，希望老师能指点一二

作者回复: 1. 就单条加法字节码而言，解释执行器需要识别字节码，然后将两个操作数从Java方法栈上读取出来并相加，最后将结果存入Java方法栈中。而JIT生成的机器码就只是一个CPU加法指令。

因为JIT比较费时。如果字节码需要JIT后才跑，那么启动性能会很糟糕

对于占据大部分的不常用的代码，我们无需耗费时间将其编译成机器码，而是采取解释执行的方式运行；
这是否意味着不常用的代码的多次调用就要多次进行解释执行

作者回复: 调用到一定次数就会触发即时编译的

对不起，听了29篇文章了，至今不太清楚hotspot和openjdk两者之间的关系。

作者回复: HotSpot是JVM里的引擎，可以理解为JDK中用C++写的部分。Oracle JDK/OpenJDK包括HotSpot。

搞不懂，没有讲清楚堆栈到底如何共享？有些文章说栈数据共享，但又说每个线程都会有一个堆栈，那堆栈的数据还如何共享？还有堆有时候说数据不共享，但又说线程间数据共享？这老师能解答一下吗？

作者回复: 线程各自的栈空间是不共享的，但可以通过堆空间来共享数据。如果只有一个线程知道某个数据存放在堆的哪个位置，那也相当于不共享。注意不是等同于不共享，因为其它线程可以扫描整个堆，来找到这个位置。

方法区是不是属于堆的一部分？

作者回复: 不属于。JVM中的堆是用来存放Java对象的。

-老师你好，我有个地方还是想不通，为什么java采用一次编译，到处运行的这种方式，而不是C++的不同平台都进行编译， java这样设计加了中间层反而执行效率降低，那这种设计的初衷是什么呢？

作者回复: 个人感觉应该是静态编译的各种语言中C++比较突出，一次编译到处运行的各种语言中Java比较典型。

你可以用LLVM把C++编译成bitcode到处运行，也可以用AOT把Java编译成机器码。只不过不是那么”流行”

-老师，即时编译是啥算法？编译哪些代码？何时编译完成？为啥我每次压测启动后，top命令查看，同样的代码编译线程工作时长不太一样？

作者回复: 即时编译就是一个编译器，里面有很多不同的优化，对应不同的算法。触发即时编译用的是JVM维护的统计方法调用次数的计数器。编译时间取决于编译器自己的效率。由于程序的不确定性，在多线程环境下即时编译器干的活可能多可能少。

02 | Java 代码是怎么运行的？

02 | Java 代码是怎么运行的？

Java 执行系统主流实现以及设计决策

C++ 可以直接编译成机器码运行，Java为什么还需要虚拟机中运行呢？

Java虚拟机具体怎么运行的java 代码？

运行效率如何？

友情链接更多精彩内容