
Mach-O
Mach-O 是运行时可执行文件的文件类型,主要包括:
-
Executable,可执行文件,应用中最重要的二进制文件,也就是应用扩展的主二进制文件; -
Dylib,动态库; -
Bundle,捆绑包,是一种特殊的动态库,不能进行链接,只能在运行时通过dlopen()打开;
Image,图像,是指以上任意三种类型。
Framework,库,包含资源文件和头文件的静态库或动态库。
Mach-O Image File
Mach-O 图像文件被划分为若干个 segment,所有的 segment 都是用大写字母命名。每个 segment 都是 page 大小的整数倍,在 64 位操作系统中是 16K,在 32 位操作系统中是 4K。
下图的例子中,__TEXT 段有 3 个页面,__DATA 和 __LINKEDIT 分别有 1 个页面。

segment 的子范围是分区,通常用小写字母表示。编译器一般会忽略段内的分区。

几乎每个二进制文件都包含三个 segment
-
__TEXT,包含了Mach的头文件,任何机器指令,只读常量,比如C字符串就放在这里; -
__DATA,可重写的内容,包含所有的全局变量; -
__LINKEDIT,包含变量函数信息,比如名称和地址
不同操作系统的 Mach-O 文件通过 Fat Header 放在一起,构成 Mach-O 通用文件。

Virtual Memory
虚拟内存通过映射进程的地址到物理地址来管理物理内存。这种映射不是一对一的,一个逻辑地址可以不对应任何物理地址,也可以多个逻辑地址对应同一个物理地址。
虚拟内存具有以下特性:
-
Page fault,如果一个逻辑地址没有对应的物理地址,当进程在访问该内存时会产生页面错误; - 当多个进程的逻辑地址对应同一个物理地址时,这几个进程可以共享相同的页面。
-
File backed pages,不需要把整个文件读入RAM中,调用mmap()函数告诉操作系统需要把部分文件映射到物理地址, -
Copy-On-Write (COW),写入时复制, - 定义
dirty pages和clean pages, - 设置
rwx权限;
Security
通过 ASLR 和 代码签名保证安全性。
ASLR,就是 Address Space Layout Randomization ,把图像文件加载到随机地址中。
代码签名,对整个文件进行一个加密哈希算法,然后在文件上签名,在运行时进行验证,所有的哈希都存储在 __LINKEDIT 中