第七章 链接——关于可执行目标文件的运行时地址与文件中偏移的一些疑问

在CSAPP链接相关章节中,书中描述了链接大概分为两步,第一步为符号解析,第二步便是重定位。其中书中描述 (P478) 重定位时会合并各个重定位目标文件中相同类型的节,然后链接器会将运行时内存地址赋给各个节

书中提到了段要加载到内存时,应该放在的地址保存在程序头部表中(Program header table),它描述了将文件各段映射到运行时内存的一些参数,但并未对运行时地址展开描述。

  • 该表记录了数据段,代码段等在文件中的偏移,以及长度,该段要被加载至内存哪个地址,以及对其要求。

猜测:

  • 数据段代码段总是被加载至内存固定的位置,即表中记录的地址。
  • 被定义的全局符号总是有固定的虚拟内存地址。
  • 在重定位的过程中,是计算符号定义的运行时地址(符号定义在内存中的地址),然后通过计算文件内部的这个引用的偏移,将其装填到这里。

=================下面不作数=====================

我们可以进行一个简单的测试:

  • 查看这个可执行目标文件的程序头部表,记录下代码段和数据段的 vaddrpaddr,然后执行该文件,查看内存代码段和数据段的地址,是否就是该表所记录的。
  • 找一个使用相对地址重定位的引用,取这个引用上的地址,然后将vaddr所记录运行地址代入计算,查看结果是否一致。

对于一个极其简单的C - testA.c 程序:

int test_var = 1;
int main(){
    test_var = 10;;
}

将其编译为可重定位目标文件,并查看这个文件的反汇编代码:

>>> gcc -c -o testA.o testA.c
>>> objdump -d -F testA.o

0000000000000000 <main> (File Offset: 0x40):
   0:   c7 05 00 00 00 00 0a    movl   $0xa,0x0(%rip)        # a <main+0xa> (File Offset: 0x4a)
   ....

我们可以看到重定位条目,在.text节内偏移 0xa 处需要进行一个重定位,这正是对全局变量 test_var 的引用,而rip存放PC值,这条指令的意思就是把常数 0xa 存放至 PC + addr 这个地址上,而此处的 addr 还未被重定位,就是一串 0

然后我们将这个可重定位目标文件链个可执行目标文件,然后查看反汇编数据:

>>> gcc -c -o testA.out testA.o

对这个可执行目标文件进行反汇编:

>>> objdump -d -F testA.out

00000000004004d6 <main> (File Offset: 0x4d6):
  4004d6:   c7 05 50 0b 20 00 0a    movl   $0xa,0x200b50(%rip)        # 601030 <test_var> (File Offset: 0x201030)
    ...
Disassembly of section .data:
0000000000601030 <test_var> (File Offset: 0x1030):

  601030:   01 00                   add    %eax,(%rax)
    ...

由于 objdump 反汇编时显示的地址是 complete address (man objdump中所述),不是文件内偏移,可以通过 -F 命令显示出具体指令在文件内部的偏移。

我们查看其程序头部表,挑出数据段与代码段相关信息:

>>> objdump -d -F testA.out
  INTERP off    0x0000000000000238 vaddr 0x0000000000400238 paddr 0x0000000000400238 align 2**0
         filesz 0x000000000000001c memsz 0x000000000000001c flags r--
    LOAD off    0x0000000000000000 vaddr 0x0000000000400000 paddr 0x0000000000400000 align 2**21
         filesz 0x0000000000000694 memsz 0x0000000000000694 flags r-x  // 代码段
    LOAD off    0x0000000000000e10 vaddr 0x0000000000600e10 paddr 0x0000000000600e10 align 2**21
         filesz 0x0000000000000224 memsz 0x0000000000000228 flags rw-  //数据段

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。