第五章 Windows PE/COFF
5.1 Windows的二进制文件格式PE/COFF
- 组成和大多ELF一样,文件头,后面若干个段,后面符号表,调试信息的内容
- COFF的文件头包括描述文件的总体结构,属性的Image Header,另外一个是段表
6.1 进程虚拟地址空间
- 每个程序被运行起来都拥有独立的虚拟地址空间,具体大小是硬件决定的,理论上是硬件内存大小,例如32位硬件,虚拟内存大小就是4GB
- 由于程序在运行的时候是在操作系统之下进行的,在分配给程序的虚拟空间中,有一部分是操作系统所占用的
6.2 装载的方式
- 程序执行时所需要的指令和数据必须在呢村中才能正常运行,最简单的就是全部装入内存,问题是当内存小的时候,并不能完全装入内存
- 考虑到了内存大小不够的情况,出现两种典型加载内存的方式:覆盖装入、页映射,都是动态装载方法,核心思想就是用到哪个模块,就将哪个模块装入内存,如果不用就存放在磁盘中
6.2.1 覆盖装入
- 目前已经被淘汰,典型的时间换空间的做法,将原有的写入磁盘,新的直接覆盖,需要用以前的再进行置换
6.2.2 页映射
- 在内存中划分的最小单位为“页”,都是以页的方式进行置换
6.3 从操作系统角度看可执行文件的装载
- 现在硬件的MMU提供地址转换的功能,因为页从磁盘加载到物理内存中,还得进行重定位,MMU就是干这个的,MMU-》硬件地址转换以及页映射机制
6.3.1 进程的建立
- 从操作系统的角度看,进程最关键的特征是独立的虚拟地址空间,这使得它有别于其他进程
- 创建一个进程,然后装载相应的可执行文件并且执行主要步骤:
1.创建独立的虚拟空间
2.读取可执行文件头,建立虚拟内存与可执行文件的映射关系
3.将CPU的指令寄存器设置成可执行文件的入口地址,启动运行
6.3.2 页错误
- 虚拟内存区域:VMA
- 当读取的页没在内存中,就认为这是一个页错误,Page Fault,CPU将控制权交给操作系统,操作系统负责后续处理,操作系统会根据映射关系找到这个数据结构,并找到空白页,建立虚拟页与物理页的映射关系,此时相关数据已经准备好了,再将控制权交给进程,进程从刚才的页错误的位置重新开始执行
6.4 进程虚拟空间分布
- 操作系统并不care加载的内容是什么,他只关心和加载相关的问题,比如段的权限(可读,可写,可执行)
- 通常代码段的权限是可读可执行,数据段和BSS段是可读可写,只读数据段的权限是只读的段
- ELF文件引入Segment概念,将相同权限的东西放在一起的划分概念,会把相同权限的section都划分到一个segment中
- 描述section属性的结构胶段表,描述segment的叫程序头,它描述了ELF文件该如何被操作系统映射到进程的虚拟空间
- 在加载虚拟内存的时候,会按照不同的segment去分配VMA
- ELF可执行文件中有一个专门的数据结构叫程序头表,用来保存segment的信息,它描述了ELF文件该如何北操作系统映射到进程的虚拟空间
- ELF目标文件因为不需要被装载,就没有程序头表
6.4.2 堆和栈
- VMA除了被用来映射可执行文件中的各个“segment”,还有其他作用,操作系统通过使用VMA对进程的地址空间进行管理
- 多数情况下每一个进程的栈和堆都有对应的VMA
6.4.5 进程栈初始化
- 进程在刚启动的时候需要一些进程运行的环境,最基本的就是系统环境变量和进程的运行参数,常见的做法是操作系统在进程启动前将这些信息提前保存到进程的虚拟空间的栈中
6.5 Linux内核装载ELF过程简介
- fork是分身,execve函数是变身,fork能复制出当前进程,execve可以在让当前进程改动
- bash进程会调用fork()创建一个新的进程,再在新的进程中调用execve(),调用指定的可执行文件
7.6 动态链接的步骤和实现
- 动态链接分3步:
1.启动动态链接器
2.装载所需要的共享对象
3.重定位和初始化
7.6.2 装载共享对象
- 动态链接器将可执行文件和链接器本身的符号表都合并到一个符号表中,我们称为全局符号表
- 链接器加载文件常见的是广度优先
- 共享对象里面的全局符号呗另一个共享对象的同名全局符号覆盖的现象叫共享对象全局符号介入
- 在Linux下一个符号需要被加入全局符号表时,如果相同的符号名已经存在,后加入的符号会被忽略