草稿
1.介绍编译器和解释器的区别,以及各自优点
2.介绍编译器的基本结构:词法分析(token stream),语法分析(syntax tree),语义分析(syntax tree),中间代码生成(intermddiate representation),优化(intermddiate representation),目标代码产生(target-machine code)。
如下图所示,所有图片均来自英文编译原理第二版。
3.其中编译阶段可以分为前段和后端,前者主要是分析(analysis),后者主要是合成(synthesis),其中整个阶段都会对符号表进行读出和写入操作
词法分析
作用:读入组成源程序的字符流,找出每个词素(lexemes),也就是有语法意义最小单位的字符或者字符串。统一格式,备用。
产出:<token-name , sttribute-value>,前者代表抽象符号,后者代表前者的符号表的入口地址。
构造方法:正则表达式,有限自动机
例:position = initial + rate * 60
经过词法分析之后将会变成<id,1> <=> <id,2> <+> <id,3> <*> <60>
上面的赋值语句经过一轮完整的编译过程如下表所示
语法分析(syntax analysis或者parsing)
作用:在词法分析基础上根据语法规则把单词符号组成各类的语法单位,例如短语,句子,程序块等。
过程:语法分析器利用词法分析器产生的token form中的第一部分token name来创建语法树,目的是用来表示token stream的语法结构。一个典型的语法树的内节点代表一个操作符,其子节点代表的是作用于操作符的操作数,样本可参看Figure 1.7中的语法分析部分。
产出:语法树
构造方法:推导和规约。用上下文无关文法和描述程序语言的语法结构。
语义分析
作用:利用语法树和符号表来检查源程序是否符合程序语言的规则,其中一个重要的过程就是类型检查。
产出:语法树(注意语义分析产生的语法树和语法分析产生的语法树的不同)
例:蚂蚁带上眼镜。这句话语法正确,但是语义却是错误的。
中间代码生成
暂略。
代码优化
暂略。
目标代码生成
暂略。
符号表管理
暂略。
4.过程组合
在实际编写编译器的过程中,可以不必按照上诉所说把每一步分的那么精细,可以将有些在逻辑上相同的步骤合并成一个称为遍的过程中,例如将词法分析、语法分析、语义分析组合成一个遍,代码优化组合成另外一个遍,等等。这样组合分类的好处是:
- 逻辑清晰
- 增加代码移植性
- 交叉语言:将前端组合成一个遍,把用语言A写的程序分析完成之后,后端我使用能够产生B语言的后端,这样就可以将一个语言编写的程序编译成适合其它机器使用的程序了。或者将许多不同语言编程的程序进行前端翻译,完成之后统一使用一个相同后端编译,这样就实现了多种语言对特定机器的编译过程。(类似Java的bytecode的生成和作用)
5.语言的发展和分类
第一代语言:机器语言
第二代语言:汇编语言
第三代语言:高级语言,例如C,C++,Fortran,Cobol,Lisp
第四代语言:应用语言,例如SQL for databse queries , Postscript for text formatting
第五代语言:逻辑语言,例如Prolog
命令式语言:告诉计算机应该如何一步步做来完成目标。例如C,C++
声明式语言:告诉计算机做什么来完成目标。例如SQL,包括后面的函数式语言和逻辑语言
区别:举个例子,随便写一个SQL的selecet语句就明白了。
函数式语言:ML,Haskell
逻辑语言:prolog
冯洛伊曼语言
面向对象语言:C++
脚本语言:shell