注:此文是我在读完周志明老师的深入理解Java虚拟机之后总结的一篇文章,请阅读此书获取更加详细的信息.
在这篇文章中,我们会简单介绍一下Java的编译过程,以及在编译过程中进行的优化.
编译过程
编译过程大致分为下面的三个过程,分别是:
- 解析与填充符号表过程
- 插入式注解处理器的注解处理过程
- 分析与字节码生成关系
它们之间的关系如下图所示:
解析和填充符号表
1.词法分析,语法分析:
词法分析是将源代码中的字符流转变为Token集合.
语法分析是根据Token序列构造抽象语法树的过程,抽象语法树是一种用来描述程序代码语法结构的树型表示方式,语法树的每一个节点都代表着程序代码中的一个语法结构,例如包,类型,修饰符,运算符,接口,返回值甚至代码注释等都可以是一个语法结构.
2.填充符号表:
符号表是由一组符号地址和符号信息构成的表格,符号表中所登记的信息在编译的不同阶段都要用到.在语义分析中,符号表所登记的内容将用于语义检查(如检查一个名字的使用和原先的说明是否一致)和产生中间代码,在目标代码生成阶段,当对符号表进行地址分配时,符号表是地址分配的依据.
注解处理器
注解处理器用于处理程序中的代码,由于注解会修改源代码,也就是会修改抽象语法树中的元素,所以如果在处理注解期间对语法树进行了修改,编译器将回到解析及填充符号表的过程重新处理,直到所有插入式注解处理器都没有再对语法树进行修改为止.
语义分析与字节码生成
在编译过程中,语义分析过程分为标注检查以及数据及控制流分析两个步骤.
1.标注检查:
标注检查步骤检查的内容包括诸如变量使用前是否已被声明,变量和赋值之间的数据类型是否能够匹配等.
2.数据及控制流分析:
数据及控制流分析是对程序上下文逻辑更进一步的验证,它可以检查出诸如程序局部变量在使用前是否有赋值,方法的每条路径是否都有返回值,是否所有的受查异常都被正确处理了等问题.
3.解语法糖:
Java中最常用的语法糖主要是前面提到过的泛型,变长参数,自动装箱/拆箱等,虚拟机运行时并不支持这些语法糖,它们在编译阶段还原回简单的基础语法结构,这个过程称为解语法糖.
4.字节码生成:
字节码生成阶段不仅仅是把前面各个步骤生成的信息(语法树,符号表)转化成字节码写到磁盘中,编译器还进行了少量的代码添加和转换工作.
例如,之前的文章提到过的实例构造器<init>()方法和类构造器<clinit>()方法就是在这个阶段添加到语法树之中的.
完成对语法树的遍历和调整之后,就会把填充了所有所需信息的符号表交给com.sun.tools.javac.jvm.ClassWriter类,由这个类的writeClass()方法输出字节码,生成最终的Class文件,到此为止整个编译过程宣告结束.
Java语法糖
泛型与类型擦除
泛型可谓是Java中最常用的几个语法糖中的一个,但是Java中的泛型和C++中的语法糖不一样,它只存在于程序代码中,在经过编译之后的Class文件中,便不再存在.
那我们是如何获取到泛型传入的参数化类型呢?
这就涉及到Class文件中的Signature,LocalVariableTypeTable等属性了.其中Signature是最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名,这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息.修改后的虚拟机规范要求所有能识别49.0以上版本的Class文件的虚拟机都要能正确地识别Signature参数.
自动装箱,拆箱与遍历循环
自动装箱,拆箱在编译之后被转化成了对应的包装和还原方法,而遍历循环则把代码还原成了迭代器的实现,这也是为何遍历循环需要被遍历的类实现Iterable接口的原因.变长参数呢,在调用的时候变成了一个数组类型的参数.
条件编译
Java中进行条件编译的方式是,使用条件为常量的if语句.在编译时,会把分支中不成立的代码块消除掉.
总结
可以看到,其实编译器并没有进行什么优化,而只是解语法糖,去掉不需要的代码而已.代码的优化实际上主要是在运行期完成,后面我们会写一篇文章专门来介绍编译器优化.