共享库so机制(全局变量)

共享库的主要作用就是共享代码也就是text section。不同进程加载同一份共享库,text是共享的,data是独立的。所以要保证text中代码的位置无关性。在x86-64中同一个模块中的符号引用可以直接用pc指针加上偏移量来解符号引用。

$ cat a.c
extern int foo;

int function(void) {
    return foo;
}
$ gcc -c a.c
$ readelf --relocs ./a.o

Relocation section '.rela.text' at offset 0x1c8 contains 1 entries:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
000000000006  000900000002 R_X86_64_PC32     0000000000000000 foo - 4

在a.o这个模块中,不知道foo的值是什么,所以编译器留下一个重定位条目,意思说“在最后的可执行二进制文件里,填充foo的符号的值,在目标文件里偏移量0x6这个位置处”,在来 看看偏移量为0x6处的地址刚好是一个4个字节的00填充。

$ objdump -d a.o
0000000000000000 <function>:
   0:   55                      push   %rbp
   1:   48 89 e5                mov    %rsp,%rbp
   4:   8b 05 00 00 00 00       mov    0x0(%rip),%eax        # a <function+0xa>
   a:   5d                      pop    %rbp
   b:   c3                      retq  

如果一个具有值的foo的符号最终编译成可执行文件,那么重定位项就不会存在。但是共享文件只到运行或者加载时才可以解引用。所以需要PIC(位置无关代码)。

$ readelf --headers /bin/ls
[...]
ELF Header:
[...]
  Entry point address:               0x8049bb0

Program Headers:
  Type           Offset             VirtAddr           PhysAddr
                 FileSiz            MemSiz              Flags  Align
[...]
  LOAD           0x0000000000000000 0x0000000000400000 0x0000000000400000
                 0x000000000001da64 0x000000000001da64  R E    200000
  LOAD           0x000000000001de00 0x000000000061de00 0x000000000061de00
                 0x0000000000000800 0x0000000000001568  RW     200000

可以看到可执行文件不是位置无关代码的,text段(具有R E权限的)必须从加载到0x400000,而data段(具有RW权限)必须加载到0x61de00处。这个执行起来没有问题,因为每个进程都有自己私有的地址空间。

$ readelf --headers /lib/libc.so.6
  LOAD           0x000000 0x00000000 0x00000000 0x1ac474 0x1ac474 R E 0x1000
  LOAD           0x1ad23c 0x001ae23c 0x001ae23c 0x02c98 0x057e0 RW  0x1000

共享库不是固定到具体内存地址空间的,而是应用程序选择随机的一个位置加入,但是可以看到data段和代码段都会有个固定的相对偏移的。也就是说代码段的任何指令和数据段的任何变量之间的距离都是一个常量。

$ cat test.c
static int foo = 100;

int function(void) {
    return foo;
}
$ gcc -fPIC -shared -o libtest.so test.c

反汇编的结果如下,可以看到加上固定foo被pc加上一个常量替换了,潜台词是“pc指针的偏移0x2002b2的值放入eax寄存器”

000000000000056c <function>:
 56c:        55         push   %rbp
 56d:        48 89 e5               mov    %rsp,%rbp
 570:        8b 05 b2 02 20 00      mov    0x2002b2(%rip),%eax        # 200828 <foo>
 576:        5d                     pop    %rbp

前面都是说的是本模块内的调用,可以用相对寻址的形式来处理so中指令引用全局变量的问题。如果一个可执行文件或者共享库需要访问另外一个共享库的data段里的数据呢?理论上应该链接时修改指令中访问的地址,但是这个就破坏了代码的共享性。解决这个问题的核心就是GOT(全局偏移表)

$ cat test.c
extern int foo;

int function(void) {
    return foo;
}
$ gcc -shared -fPIC -o libtest.so test.c
$ objdump --disassemble libtest.so
[...]
00000000000005ac <function>:
 5ac:        55         push   %rbp
 5ad:        48 89 e5               mov    %rsp,%rbp
 5b0:        48 8b 05 71 02 20 00   mov    0x200271(%rip),%rax        # 200828 <_DYNAMIC+0x1a0>
 5b7:        8b 00                  mov    (%rax),%eax
 5b9:        5d                     pop    %rbp
 5ba:        c3                     retq

$ readelf --sections libtest.so
Section Headers:
  [Nr] Name              Type             Address           Offset
       Size              EntSize          Flags  Link  Info  Align
[...]
  [20] .got              PROGBITS         0000000000200818  00000818
       0000000000000020  0000000000000008  WA       0     0     8

$ readelf --relocs libtest.so
Relocation section '.rela.dyn' at offset 0x418 contains 5 entries:
  Offset          Info           Type           Sym. Value    Sym. Name + Addend
[...]
000000200828  000400000006 R_X86_64_GLOB_DAT 0000000000000000 foo + 0

通过反汇编可以看到,通过把0x200271(%rip)放入寄存器rax,这个地址计算结果为200828,通过查看section头可以看到,这个地址属于got分节,然后在重定位分节里可以看到一个重定位条目,就是需要找到这个符号foo,并且填充这个值。当这个库文件被加载时,动态加载器就会检查重定位条目,然后来解引用,并且填充got中的值。注意的是是got属于data段,所以代码保持了共享性。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容