语言处理器（编译器与解释器辨析）

编译器

简而言之，编译器就是一个程序，可以阅读以某一种语言（即源语言）编写的程序，并把该程序翻译成一个等价的、用另一种语言（即目标语言）编写的程序。

编译器的一个重要任务，就是报告它在翻译过程中发现的源程序中的错误。

编译器.png

目标程序：若目标程序是一个可执行的机器语言程序，那它可以被用户调用，处理输入并产生输出。

运行目标程序.png

解释器是另一种常见的语言处理器，它并不通过翻译的方式生成目标程序。从用户的角度看，解释器直接利用用户提供的输入，执行源程序中的指定操作，产生输出。

解释器.png

在把用户输入映射成为输出的时候，由一个编译器产生的机器语言目标程序通常比解释器快得多。

但是，解释器的错误诊断效果通常要比编译器更好，因为解释器逐个语句地执行源程序。

Java语言处理器结合了解释和编译过程。
一个Java源程序首先被编译成一个称为字节码（bytecode）的中间表示形式。

然后由一个虚拟机对得到的字节码加以解释执行。

一个混合编译器.png

这样安排的好处之一是，在一台机器上编译得到的字节码可以在另一台机器上解释执行。通过网络就可以完成机器之间的迁移。

为了更快地完成输入到输出之间的处理，有些被称为即时（just in time）编译器的Java编译器，在运行中间程序处理输入的前一刻，首先将字节码翻译成机器语言，然后再执行程序。

如图，在创建一个可执行的目标程序时，除了编译器之外，还需要一些其他程序。

一个语言处理系统.png

一个源程序可能被分割成多个模块，存放在独立的文件中。

预处理器（preprocessor）：把源程序聚合在一起：把称为宏的缩写形式转换为源语言的语句。

编译器：将经过预处理的源程序作为输入，产生一个汇编语言程序作为其输出。

汇编器（assembler）：处理汇编语言程序，生成可重定位的机器代码。

大型程序经常被分成多个部分进行编译，因此，可重定位的机器代码必须和其他可重定位的目标文件以及库文件连接到一起，形成真正的在机器上运行的代码。

链接器（linker）：将多个可重定位的机器代码文件（包括库文件）连接到一起。一个文件中的代码可能指向另一个文件中的位置，而链接器可以解决外部内存地址问题。

加载器（loader）：修改可重定位地址，将修改后的指令和数据放到合适的位置。