Mach-O
Mach-O
是运行时可执行文件的文件类型,主要包括:
-
Executable
,可执行文件,应用中最重要的二进制文件,也就是应用扩展的主二进制文件; -
Dylib
,动态库; -
Bundle
,捆绑包,是一种特殊的动态库,不能进行链接,只能在运行时通过dlopen()
打开;
Image
,图像,是指以上任意三种类型。
Framework
,库,包含资源文件和头文件的静态库或动态库。
Mach-O Image File
Mach-O
图像文件被划分为若干个 segment
,所有的 segment
都是用大写字母命名。每个 segment
都是 page
大小的整数倍,在 64
位操作系统中是 16K
,在 32
位操作系统中是 4K
。
下图的例子中,__TEXT
段有 3 个页面,__DATA
和 __LINKEDIT
分别有 1 个页面。
segment
的子范围是分区,通常用小写字母表示。编译器一般会忽略段内的分区。
几乎每个二进制文件都包含三个 segment
-
__TEXT
,包含了Mach
的头文件,任何机器指令,只读常量,比如C
字符串就放在这里; -
__DATA
,可重写的内容,包含所有的全局变量; -
__LINKEDIT
,包含变量函数信息,比如名称和地址
不同操作系统的 Mach-O
文件通过 Fat Header
放在一起,构成 Mach-O
通用文件。
Virtual Memory
虚拟内存通过映射进程的地址到物理地址来管理物理内存。这种映射不是一对一的,一个逻辑地址可以不对应任何物理地址,也可以多个逻辑地址对应同一个物理地址。
虚拟内存具有以下特性:
-
Page fault
,如果一个逻辑地址没有对应的物理地址,当进程在访问该内存时会产生页面错误; - 当多个进程的逻辑地址对应同一个物理地址时,这几个进程可以共享相同的页面。
-
File backed pages
,不需要把整个文件读入RAM
中,调用mmap()
函数告诉操作系统需要把部分文件映射到物理地址, -
Copy-On-Write (COW)
,写入时复制, - 定义
dirty pages
和clean pages
, - 设置
rwx
权限;
Security
通过 ASLR
和 代码签名保证安全性。
ASLR
,就是 Address Space Layout Randomization
,把图像文件加载到随机地址中。
代码签名,对整个文件进行一个加密哈希算法,然后在文件上签名,在运行时进行验证,所有的哈希都存储在 __LINKEDIT
中