本质:
链接器本质上也是一个程序:是将编译器产生的目标文件打包成可执行文件或者库文件或者目标文件的程序。
静态链接和动态链接
静态链接的意思是说把所有的机器指令一股脑全部打包到可执行程序中,
动态链接的意思是我们不把动态链接的部分打包到可执行程序,而是在可执行程序运行起来后去内存中找动态链接的那部分代码。
动态链接两种情况
- load-time dynamic linking(加载时动态链接)
- run-time dynamic linking(运行时动态链接)
符号表
第一阶段
编译器在将源文件编译生成目标文件时可以确定一下两件事:
- 定义在该源文件中函数的内存地址
- 定义在该源文件中全局变量的内存地址
这里的内存地址其实只是相对地址,相对于谁的呢,相对于自己的。为什么只是一个相对地址。因为在生成一个目标文件时编译器并不知道这个目标文件要和哪些目标文件进行链接生成最后的可执行文件,而链接器是知道要链接哪些目标文件的。因此编译器仅仅生成一个相对地址。
编译器在编译过程中每次遇到一个全局变量或者函数名都会在符号表中添加一项,最终编译器会统计出如下所示的一张符号表。
相对地址是编译器在编译过程中确定了,在链接器完成后被链接器修正为最终地址,而对于编译器没有确定的所引用的外部函数以及变量的地址,编译器将其记录在了.rel.text和.rel.data中。
第二阶段
由于在第一阶段中,所有函数以及数据都有了最终地址,因此重定位的第二阶段就相对简单了。我们知道编译器引用外部变量时将机器指令中的引用地址设置为空(比如call 0x000000),并将该信息记录在了目标文件的.rel.text以及.rel.data段中。因此在这个阶段链接器依次扫描所有的.rel.text以及.rel.data段并找到相应变量的最终地址(这些位置都已在第一阶段确定),并将机器指令中的0x000000修正为所引用变量的最终地址就可以了。
符号表编译的时候开始生成,最终完成是在链接后。
重定向
链接器会将所有的目标文件进行合并,所有目标文件的数据段合并到可执行文件的数据段,所有目标文件的代码段合并到可执行文件的代码段。当所有合并完成后,各个目标文件中的相对地址也就确定了。因此在这个阶段,链接器需要修正目标文件中的相对地址。