共享库的主要作用就是共享代码也就是text section。不同进程加载同一份共享库,text是共享的,data是独立的。所以要保证text中代码的位置无关性。在x86-64中同一个模块中的符号引用可以直接用pc指针加上偏移量来解符号引用。
$ cat a.c
extern int foo;
int function(void) {
return foo;
}
$ gcc -c a.c
$ readelf --relocs ./a.o
Relocation section '.rela.text' at offset 0x1c8 contains 1 entries:
Offset Info Type Sym. Value Sym. Name + Addend
000000000006 000900000002 R_X86_64_PC32 0000000000000000 foo - 4
在a.o这个模块中,不知道foo的值是什么,所以编译器留下一个重定位条目,意思说“在最后的可执行二进制文件里,填充foo的符号的值,在目标文件里偏移量0x6这个位置处”,在来 看看偏移量为0x6处的地址刚好是一个4个字节的00填充。
$ objdump -d a.o
0000000000000000 <function>:
0: 55 push %rbp
1: 48 89 e5 mov %rsp,%rbp
4: 8b 05 00 00 00 00 mov 0x0(%rip),%eax # a <function+0xa>
a: 5d pop %rbp
b: c3 retq
如果一个具有值的foo的符号最终编译成可执行文件,那么重定位项就不会存在。但是共享文件只到运行或者加载时才可以解引用。所以需要PIC(位置无关代码)。
$ readelf --headers /bin/ls
[...]
ELF Header:
[...]
Entry point address: 0x8049bb0
Program Headers:
Type Offset VirtAddr PhysAddr
FileSiz MemSiz Flags Align
[...]
LOAD 0x0000000000000000 0x0000000000400000 0x0000000000400000
0x000000000001da64 0x000000000001da64 R E 200000
LOAD 0x000000000001de00 0x000000000061de00 0x000000000061de00
0x0000000000000800 0x0000000000001568 RW 200000
可以看到可执行文件不是位置无关代码的,text段(具有R E权限的)必须从加载到0x400000,而data段(具有RW权限)必须加载到0x61de00处。这个执行起来没有问题,因为每个进程都有自己私有的地址空间。
$ readelf --headers /lib/libc.so.6
LOAD 0x000000 0x00000000 0x00000000 0x1ac474 0x1ac474 R E 0x1000
LOAD 0x1ad23c 0x001ae23c 0x001ae23c 0x02c98 0x057e0 RW 0x1000
共享库不是固定到具体内存地址空间的,而是应用程序选择随机的一个位置加入,但是可以看到data段和代码段都会有个固定的相对偏移的。也就是说代码段的任何指令和数据段的任何变量之间的距离都是一个常量。
$ cat test.c
static int foo = 100;
int function(void) {
return foo;
}
$ gcc -fPIC -shared -o libtest.so test.c
反汇编的结果如下,可以看到加上固定foo被pc加上一个常量替换了,潜台词是“pc指针的偏移0x2002b2的值放入eax寄存器”
000000000000056c <function>:
56c: 55 push %rbp
56d: 48 89 e5 mov %rsp,%rbp
570: 8b 05 b2 02 20 00 mov 0x2002b2(%rip),%eax # 200828 <foo>
576: 5d pop %rbp
前面都是说的是本模块内的调用,可以用相对寻址的形式来处理so中指令引用全局变量的问题。如果一个可执行文件或者共享库需要访问另外一个共享库的data段里的数据呢?理论上应该链接时修改指令中访问的地址,但是这个就破坏了代码的共享性。解决这个问题的核心就是GOT(全局偏移表)
$ cat test.c
extern int foo;
int function(void) {
return foo;
}
$ gcc -shared -fPIC -o libtest.so test.c
$ objdump --disassemble libtest.so
[...]
00000000000005ac <function>:
5ac: 55 push %rbp
5ad: 48 89 e5 mov %rsp,%rbp
5b0: 48 8b 05 71 02 20 00 mov 0x200271(%rip),%rax # 200828 <_DYNAMIC+0x1a0>
5b7: 8b 00 mov (%rax),%eax
5b9: 5d pop %rbp
5ba: c3 retq
$ readelf --sections libtest.so
Section Headers:
[Nr] Name Type Address Offset
Size EntSize Flags Link Info Align
[...]
[20] .got PROGBITS 0000000000200818 00000818
0000000000000020 0000000000000008 WA 0 0 8
$ readelf --relocs libtest.so
Relocation section '.rela.dyn' at offset 0x418 contains 5 entries:
Offset Info Type Sym. Value Sym. Name + Addend
[...]
000000200828 000400000006 R_X86_64_GLOB_DAT 0000000000000000 foo + 0
通过反汇编可以看到,通过把0x200271(%rip)放入寄存器rax,这个地址计算结果为200828,通过查看section头可以看到,这个地址属于got分节,然后在重定位分节里可以看到一个重定位条目,就是需要找到这个符号foo,并且填充这个值。当这个库文件被加载时,动态加载器就会检查重定位条目,然后来解引用,并且填充got中的值。注意的是是got属于data段,所以代码保持了共享性。