CSAPP学习总结

虚拟内存

CPU是如何做到寻址的?

举个例子

#include <stdio.h>
extern void ext();
int main() 
{
    printf("Hello World\n");
    ext();
    return 0;
}

对于如上代码,程序运行时是通过0x8049000这个地址找到printf函数的实现:

Dump of assembler code for function main:
   0x000000000800063a <+0>:     push   %rbp
   0x000000000800063b <+1>:     mov    %rsp,%rbp
=> 0x000000000800063e <+4>:     lea    0x9f(%rip),%rdi        # 0x80006e4

   0x0000000008000645 <+11>:    callq  0x8049000<puts@plt>

   0x000000000800064a <+16>:    mov    $0x0,%eax
   0x000000000800064f <+21>:    pop    %rbp
---Type <return> to continue, or q <return> to quit---

那么问题来了:

  1. 0x8049000是物理地址还是虚拟地址?
    ——答:虚拟地址;
  2. CPU如何找到这个地址对应的数据?
    ——答:CPU根据虚拟地址做页映射,进而找到物理内存页,再根据数据页内偏移找到最终的函数实现。

虚拟地址

为了说明一条虚拟地址的构成和作用,我们简单通过下面两幅图来介绍。

虚拟地址 vs 虚拟页 vs 物理页

image.png

CPU初次访问0x8049000地址流程

image.png

Linux下进程虚拟地址空间 vs 数据结构

image.png

链接装载

谈到动态链接,我们就不得不谈PLT以及GOT了。

GOT

又名全局偏移表, GOT完全是为了实现“代码地址无关”(PIC)技术,即通过新增对外部符号的指针,从而实现一份动态库代码段无视被任意进程装载到任意地址处,进而解决了共享代码段的复用(相比静态链接,同事节省了磁盘和物理内存)。

PLT

又名过程链接表,PLT实质就是延迟绑定技术的实现,即为了解决动态库间接寻址效率低下的问题,动态库将所有外部引用推迟到运行时装载,而且只在第一次引用符号时进行重定位!

运行时重定位

下面以main程序多次调用ext@plt为例,为大家展示PLT和GOT是如何配合动态链接器实现符号运行时重定位的:
.got一般位于ELF的数据段

image.png

main程序调用外部函数ext
image.png

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容