MachO文件分析

MachO文件

Mach-O是Mach Object文件格式的缩写,是mac以及iOS上可执行文件的格式。是一种用于可执行文件、目标代码、动态库的文件格式。作为a.out格式的替代,Mach-O提供了更强的扩展性。
类似于windows上的PE格式 (Portable Executable ),linux上的elf格式 (Executable and Linking Format)

Mach-O文件格式

  • 目标文件.o
  • 库文件
    • .a
    • .dylib
    • framework
  • 可执行文件
  • dyld
  • .dsym

实际开发中,MatchO文件有很多不同的类型,可以通过在Xcode上指定。
TargetsBuild SettingsLinkingMach-O Type

通用二进制文件

  • 苹果公司提出的一种程序代码,能同时适用多种架构的二进制文件。
  • 同一个程序包中同时为多种架构提供最理想的性能。
  • 因为需要储存多种代码,通常比单一平台二进制的程序要大。
  • 由于执行中只调用一部分代码,运行起来也不需要额外的内存。

在Xcode编译可以指定生成哪些架构的Match-O文件,同时也可以添加其他架构
TargetsBuild SettingsArchitecturesArchitectures

设备的CPU架构(指令集)

  • 模拟器:
    • 4s-5: i386
    • 5s-6s Plus: x86_64
  • 真机(iOS设备):
    • armv6: iPhone、iPhone 2、iPhone 3G、iPod Touch(第一代)、iPod Touch(第二代)
    • armv7: iPhone 3Gs、iPhone 4、iPhone 4s、iPad、iPad 2
    • armv7s: iPhone 5、iPhone 5c
    • arm64: iPhone 5s之后机型

Mach-O架构拆分、合并

  1. lipo工具
  • 查看MachO架构

$lipo -info 'MachO文件'

  • 拆分MachO架构

$lipo 'MachO文件' –thin '架构名' –output '目标MachO文件'

  • 合并MachO架构

$lipo -create '第一个MachO文件' '第二个MachO文件 -output '目标MachO文件'

  1. file指令:查看文件信息

$file 文件路径

MachO文件结构

Mach-O 的组成结构如图所示,主要包括三个部分:Header、Load commands、Data

Header

包含二进制文件的一般信息,架构类型、字节顺序、加载指令的数量等。

struct mach_header_64 {
    uint32_t        magic;          /* mach magic number identifier */
    cpu_type_t      cputype;        /* cpu specifier */
    cpu_subtype_t   cpusubtype;     /* machine specifier */
    uint32_t        filetype;       /* type of file */
    uint32_t        ncmds;          /* number of load commands */
    uint32_t        sizeofcmds;     /* the size of all the load commands */
    uint32_t        flags;          /* flags */
    uint32_t        reserved;       /* reserved */
};

magic:定位结构是64位还是32位 (e.g. MH_MAGIC_64)
cputype:CPU类型 (e.g. CPU_TYPE_ARM64)
cpusubtype:CPU具体类型 (e.g. CPU_SUBTYPE_ARM64_ALL)
filetype:文件类型 (e.g. MH_EXECUTE)
ncmds:Load Commands条数
sizeofcmds:Load Commands大小
flags:标志位。标识二进制文件支持的功能,主要和系统加载、链接有关
reserved:预留区(只有64位才有)

Load Commands

包含区域的位置、符号表、动态符号表等。描述了文件中数据的具体组织结构,不同的数据类型使用不同的加载命令表示。

  • LC_SEGMENT_64(__PAGEZERO)
    • VM Size:虚拟内存,大小4G(32位是16M)。用于区分32位及存储位置
  • LC_SEGMENT_64(__TEXT)
  • LC_SEGMENT_64(__DATA)
  • LC_SEGMENT_64(__LINKEDIT)
    • VM Address:虚拟内存地址
    • VM Size:虚拟内存大小
    • File Offset:数据在文件中的起始位置
    • File Size:数据在文件中的大小
  • LC_DYLD_INFO_ONLY(动态链接相关信息)
    • Rebase:进行重定向的位置信息。当MachO加载到内存里,系统会随机分配一个内存偏移大小aslr,和rebase里面的offset,对接(位置相加)获取代码在内存中的实际位置。再根据size开辟实际内存
    • Binding:绑定的位置信息
    • Weak Binding:弱绑定的位置信息
    • Lazy Binding:懒加载绑定的位置信息
    • Export:对外的位置信息
  • LC_SYMTAB(符号表地址)
    • Symbol Table Offset:符号表的位置。函数名称、函数地址关联的信息
    • Number of Symbol:符号数
    • String Table Offset:符号名称位置
    • String Table Size:符号名称大小
  • LC_DYSYMTAB(动态符号表地址)
  • LC_LOAD_DYLINKER(动态库连接器:dyld)
    • Str Offset:动态库连接器位置
    • Name:动态库连接器路径(dyld)
  • LC_UUID(MachO文件唯一标识)
  • LC_VERSION_MIN_IPHONESOS(MachO文件支持最低的操作系统版本)
  • LC_SOURCE_VERSION(源代码版本)
  • LC_MAIN(MachO程序入口:设置程序主线程的入口地址和栈大小)
    • Entry Offset:入口位置
    • Stacksize:堆栈大小
    • Entry Point:入口点(内存地址)
  • LC_ENCRYPTION_INFO_64(加密信息)
    • Crypt Offset:加密信息位置
    • Crypt Size:加密信息大小
    • Crypt ID:加密信息ID。非加密是0,加密是1
  • LC_LOAD_DYLIB(依赖库的路径,包含三方库)
    • Str Offset:动态库位置
    • Time Stamp:动态库时间
    • Current Version:动态库版本
  • LC_RPATH(frameworks信息)
  • LC_FUNCTION_STARTS(函数的起始位置表)
  • LC_DATA_IN_CODE(代码数据信息)
  • LC_CODE_SIGNATURE(代码签名信息)

Data

由 Segment 段和 Section 节组成。存放具体数据:代码、数据、字符串常量、类、方法等。

  1. Segment 组成
#define SEG_PAGEZERO    "__PAGEZERO" /* 当时 MH_EXECUTE 文件时,捕获到空指针 */
#define SEG_TEXT    "__TEXT" /* 代码/只读数据段 */
#define SEG_DATA    "__DATA" /* 数据段 */
#define SEG_OBJC    "__OBJC" /* Objective-C runtime 段 */
#define SEG_LINKEDIT    "__LINKEDIT" /* 包含需要被动态链接器使用的符号和其他表,包括符号表、字符串表等 */
  1. Segment 的数据结构
struct segment_command_64 { 
    uint32_t    cmd;        /* LC_SEGMENT_64 */
    uint32_t    cmdsize;    /* section_64 结构体所需要的空间 */
    char        segname[16];    /* segment 名字,上述宏中的定义 */
    uint64_t    vmaddr;     /* 所描述段的虚拟内存地址 */
    uint64_t    vmsize;     /* 为当前段分配的虚拟内存大小 */
    uint64_t    fileoff;    /* 当前段在文件中的偏移量 */
    uint64_t    filesize;   /* 当前段在文件中占用的字节 */
    vm_prot_t   maxprot;    /* 段所在页所需要的最高内存保护,用八进制表示 */
    vm_prot_t   initprot;   /* 段所在页原始内存保护 */
    uint32_t    nsects;     /* 段中 Section 数量 */
    uint32_t    flags;      /* 标识符 */
};
  1. Section 数据结构
    部分的 Segment (主要指的 __TEXT 和 __DATA)进一步分解为 Section。
struct section_64 { 
    char        sectname[16];   /* Section 名字 */
    char        segname[16];    /* Section 所在的 Segment 名称 */
    uint64_t    addr;       /* Section 所在的内存地址 */
    uint64_t    size;       /* Section 的大小 */
    uint32_t    offset;     /* Section 所在的文件偏移 */
    uint32_t    align;      /* Section 的内存对齐边界 (2 的次幂) */
    uint32_t    reloff;     /* 重定位信息的文件偏移 */
    uint32_t    nreloc;     /* 重定位条目的数目 */
    uint32_t    flags;      /* 标志属性 */
    uint32_t    reserved1;  /* 保留字段1 (for offset or index) */
    uint32_t    reserved2;  /* 保留字段2 (for count or sizeof) */
    uint32_t    reserved3;  /* 保留字段3 */
};

以下列举一些常见的 Section:

__TEXT,__text: 主程序代码
__TEXT,__stubs / __stub_helper: 用于动态链接的桩
__TEXT,__objc_methname: OC方法名称
__TEXT,__objc_classname: OC类名
__TEXT,__objc_methtype: OC方法类型
__TEXT,__cstring: 程序中c语言字符串
__DATA,__got: 非懒加载符号表
__DATA,__la_symbol_ptr: 懒加载符号表
__DATA,__objc_classlist: OC类列表
__DATA,__objc_protollist: OC原型列表
__DATA,__objc_imageinfo: OC镜像信息
__DATA,__objc_const: OC常量
__DATA,__objc_selfrefs: OC类自引用(self)
__DATA,__objc_superrefs: OC类超类引用(super)
__DATA,__objc_protolrefs: OC原型引用
__DATA,__objc_data / __data: OC代码数据
Dynamic Loader Info: 动态链接器所需要使用的信息 (重定向,符号绑定,懒加载绑定等..)
Function Starts: 方法的起始位置
Symbol Table: 符号表
Dynamic Symbol Table: 动态符号表
String Table: 字符串表
Code Signature: 代码签名信息

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,588评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,456评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,146评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,387评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,481评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,510评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,522评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,296评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,745评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,039评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,202评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,901评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,538评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,165评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,415评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,081评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,085评论 2 352

推荐阅读更多精彩内容