编译链接过程
一个完整的编译链接过程包含了以下步骤:
- 预编译
- 编译
- 汇编
- 链接
预编译
预编译的处理规则如下
- 删除#define,并且展开所有的宏定义
- 处理条件预编译指令,#if/#ifdef/#elif/#else/#endif
- 递归处理#include
- 删除注释 // /注释/
- 添加行好和文件标识,以便编译时产生的错误或警告时能显示行号
- 保留#pragma编译指令,编译阶段需要使用到
gcc -E hello.c -o hello.i
编译
编译把预编译生成的文件进行一些列的词法语法分析生成汇编代码
gcc -S hello.i -o hello.s
# 或者
gcc -S hello.c -o hello.s
汇编
汇编是将汇编代码转换成机器可以执行的指令(称为目标文件)
as hello.s -o hello.o
# 或者
gcc -c hello.c -o hello.o
gcc -c hello.s -o hello.o
链接
把目标文件链接最终生成可执行文件
/Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/ld" -demangle -lto_library /Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/libLTO.dylib -no_deduplicate -dynamic -arch x86_64 -macosx_version_min 10.13.0 -o a.out /var/folders/nw/w87gck5x1mb57_rh9_g1cyd80000gn/T/hello-316635.o -lSystem /Users/aron/softwares/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/lib/clang/9.0.0/lib/darwin/libclang_rt.osx.a
# 去掉路径的简化版本
ld -demangle -lto_library libLTO.dylib -no_deduplicate -dynamic -arch x86_64 -macosx_version_min 10.13.0 -o a.out hello.o -lSystem libclang_rt.osx.a
其中编译过程是复杂度最高的本部分,包含了
- 词法分析
- 语法分析
- 语义分析
- 中间语言生成
编译过程展开
词法分析
源码输入到扫描器,分割为一系列的记号(Token),现成的工具lex
Yacc 与 Lex 快速入门 https://www.ibm.com/developerworks/cn/linux/sdk/lex/
# lex-code-snipet.c 文件内容
# arrar[index] = (index + 4) * (2 + 6)
lex -t lex-code-snipet.c > lex-code-result.yyc
语法分析
把语法分析的结果转换为表达式树
现成的工具yacc
Yacc 与 Lex 快速入门 https://www.ibm.com/developerworks/cn/linux/sdk/lex/
语义分析
分析语法树的表达式是否合法
静态语义分析:
- 浮点型的表达式赋值给整形表达式,隐含了转换过程
-
浮点型的表达式赋值给指针,语义分析会检测出类型不匹配编译器将会报错
中间语言生成
源码级别会有一个优化的过程(Source Code optimizer),优化后的语法树如下
源码优化器往往将整个语法树转换成中间代码,他是语法树的顺序标识,和目标代码非常接近,与机器的运行环境无关,不包含数据的尺寸、变量的地址和寄存器名称,常见的中间代码是三地址码(Three-Address Code)
中间代码是的编译器可以被分为编译前端和编译后端
- 编译前端生成和目标机器无关的中间代码
- 编译后端把中间代码转换为目标机器的代码
模块拼装-静态链接
链接的主要内容就是把各个模块之间相互引用的部分都处理好,使得各个模块之间能够正确的衔接,链接过程包含:
- 地址空间分配
- 符号决议
- 重定位
链接过程解析:
- main.o 依赖 func.o foo函数
- main.o 和 func.o 分开独立编译
- main.o 预留func.o foo符号的地址
- 拼接main.o 和 func.o 是修正main.o 中预留的 foo符号的地址,这个过程称为重定位(Relocation)
这个地址修正的过程称为重定位(Relocation),每个要被修正的地方叫重定位入口(Relocation Entry)