HOOK概述
HOOK,中文译为“挂钩”或“钩子”。在iOS逆向中是指改变程序运行流程的一种技术。通过HOOK可以让别人的程序执行自己所写的代码。在逆向中经常使用这种技术。所以在学习过程中,我们重点要了解其原理,这样能够对恶意代码进行有效的防护
HOOK示意图
iOS中HOOK技术的几种方式:
Method Swizzle:主要用于OC方法,利用OC的Runtime特性,动态改变SEL(方法编号)和IMP(方法实现)的对应关系,达到OC方法调用流程改变的目的fishhook:MachO文件的工具。利用MachO文件加载原理,通过修改懒加载和非懒加载两个表的指针,达到对C函数进行HOOK的目的Cydia Substrate:原名为Mobile Substrate,它的主要作用是针对OC方法、C函数以及函数地址进行HOOK操作。当然它并不是仅仅针对iOS而设计的,安卓一样可以使用。官方地址
Method Swizzle
利用OC的Runtime特性,动态改变SEL(方法编号)和IMP(方法实现)的对应关系,达到OC方法调用流程改变的目的。主要用于OC方法。
在
OC中,SEL和IMP之间的关系,就好像一本书的“目录”
SEL是方法编号,就像“标题”一样IMP是方法实现的真实地址,就像“页码”一样- 它们是一一对应的关系
Runtime提供了交换两个SEL和IMP对应关系的函数OBJC_EXPORT void method_exchangeImplementations(Method _Nonnull m1, Method _Nonnull m2) OBJC_AVAILABLE(10.5, 2.0, 9.0, 1.0, 2.0);通过这个函数交换两个
SEL和IMP对应关系的技术,我们称之为Method Swizzle(方法欺骗)
多种
HOOK方式
class_addMethod方式:让原始方法可以被调用,不至于因为找不到SEL而崩溃class_replaceMethod方式:直接给原始的方法替换IMPmethod_setImplementation方式:直接重新赋值新的IMP
Cydia Substrate
MobileHooker顾名思义用于
HOOK。它定义一系列的宏和函数,底层调用objc的runtime和fishhook来替换系统或者目标应用的函数其中有两个函数:
MSHookMessageEx:主要作用于Objective-C方法void MSHookMessageEx(Class class, SEL selector, IMP replacement, IMP result)
MSHookFunction:主要作用于C和C++函数,Logos语法的%hook就是对以下函数做了一层封装void MSHookFunction(void function, void* replacement, void** p_original)
MobileLoader
MobileLoader用于加载第三方dylib在运行的应用程序中。启动时MobileLoader会根据规则把指定目录的第三方的动态库加载进去,第三方的动态库也就是我们写的破解程序
safe mode破解程序本质是
dylib,寄生在别人进程里。 系统进程一旦出错,可能导致整个进程崩溃,崩溃后就会造成iOS瘫痪。所以Cydia Substrate引入了安全模式,在安全模式下所有基于Cydia Substratede的三方dylib都会被禁用,便于查错与修复
fishHook
获取代码
git clone https://github.com/facebook/fishhook.git关键函数
FISHHOOK_VISIBILITY int rebind_symbols(struct rebinding rebindings[], size_t rebindings_nel);
rebindings:存放rebinding结构体的数组,可以同时交换多个函数rebindings_nel:数组的长度
rebinding结构体struct rebinding { const char *name; void *replacement; void **replaced; };
name:需要HOOK的函数名称,C字符串replacement:新函数的地址replaced:原始函数地址的指针
案例1:
HOOK系统NSLog函数打开
ViewController.m文件,定义新函数void my_NSLog(NSString *format, ...) { format = [format stringByAppendingString:@"~~~🍺🍺🍺🍺🍺"]; sys_NSLog(format); }定义函数指针,用于保存
NSLog系统函数地址static void (*sys_NSLog)(NSString *format, ...);
viewDidLoad方法中,写入以下代码:- (void)viewDidLoad { [super viewDidLoad]; struct rebinding reb; reb.name="NSLog"; reb.replacement=my_NSLog; reb.replaced=(void *)&sys_NSLog; struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1); }添加
touchesBegan方法-(void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event { NSLog(@"hahaha"); }真机运行项目,点击屏幕,输出以下内容:
fishhookDemo[2072:399007] hahaha~~~🍺🍺🍺🍺🍺
fishHook可以HOOK我们的C函数,但是我们知道函数是静态的,也就是说在编译的时候,编译器就知道了它的实现地址,这也是为什么C函数只写函数声明调用时会报错。那么为什么fishHook还能够改变C函数的调用呢?难道函数也有动态的特性存在?
案例2:
HOOK自定义函数打开
ViewController.m文件,定义自定义函数void test(NSString *format, ...){ NSLog(@"hahaha"); }定义新函数
void my_test(NSString *format, ...){ format = [format stringByAppendingString:@"~~~🍺🍺🍺🍺🍺"]; sys_test(format); }定义函数指针,用于保存
test自定义函数地址static void (*sys_test)(NSString *format, ...);
viewDidLoad方法中,写入以下代码:- (void)viewDidLoad { [super viewDidLoad]; struct rebinding reb; reb.name="test"; reb.replacement=my_test; reb.replaced=(void *)&sys_test; struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1); }添加
touchesBegan方法-(void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event { test(@"hahaha"); }真机运行项目,点击屏幕,输出以下内容:
fishhookDemo[2117:410009] hahaha在
案例2中,HOOK自定义test函数并没有效果。NSLog是系统函数,而test是当前MachO中的函数,它们之间有什么区别?
fishHook原理探究
一般来说,静态语言通过地址直接访问,例如
案例2中的test函数。但对于NSLog系统函数来说,它属于外部调用函数,编译时并不能找到它的真实地址
NSLog存储在Fundation框架中,App运行在不同系统版本的不同设备上,每个设备中NSLog的函数地址都各不相同再有,当
App启动时,会涉及ASLR(地址空间配置随机加载),导致程序运行它的虚拟内存地址都不一样这些原因,都会造成外部函数的真实地址,在编译时期是无法确定的
那外部函数是如何被调用的?
当
App启动时,dyld读取主程序MachO文件,会加载共享缓存中的系统库,将用到的函数真实地址告诉MachO对于
MachO中的代码段来说,它是只读的。在运行时,无法直接修改外部函数的真实地址对于上述情况,苹果采用
PIC技术(位置独立代码),在MachO调用外部函数时,在可读可写的数据段,定义符号,占8字节,用来存放外部函数的地址。编译时,暂存占位地址。运行时,dyld将符号绑定真实函数地址。对于代码段来说,并没有任何改变
故此,外部调用函数,并不是直接地址访问,而是通过符号找到地址。这跟
OC中SEL与IMP的对应关系非常相似。这种机制,可以让开发者动态HOOK外部调用函数在
OC中动态改变SEL与IMP的对应关系,对于外部调用函数,动态改变的是符号和地址的对应关系,上述操作称为:符号表重绑定
案例1
查看
NSLog加载前的占位地址查看
MachO文件
NSLog函数,存储在懒加载符号表中。dyld加载MachO时,绑定非懒加载符号和弱引用符号,而懒加载符号,则是在首次使用时动态绑定打开
ViewController.m文件,修改viewDidLoad代码- (void)viewDidLoad { [super viewDidLoad]; NSLog(@"begin"); struct rebinding reb; reb.name="NSLog"; reb.replacement=my_NSLog; reb.replaced=(void *)&sys_NSLog; struct rebinding rebs[] = { reb }; rebind_symbols(rebs, 1); NSLog(@"end"); }在
begin和end设置两处断点,真机运行项目
使用
image list命令,找到程序虚拟内存的首地址
- 首地址:
0x102c48000ASLR:0x2c48000查看
NSLog在MachO中的偏移地址和占位地址
- 偏移地址:
0xC000- 占位地址:
0x1000064C0在
lldb中,使用程序首地址 + 偏移地址,找到NSLog加载前的占位地址
- 在
lldb中,获取的NSLog占位地址为0x102c4e4c0,和MachO中看到的0x1000064C0并不一样因为
MachO中的占位地址,还要加上程序启动时的ASLR随机偏移地址
占位地址 + ASLR = 0x102c4e4c0,和lldb中读取出的地址一致
案例2
查看
NSLog加载后的真实地址承接
案例1,断点向下执行
在
lldb中,使用程序首地址 + 偏移地址,找到NSLog加载后的真实地址
- 之前的占位地址
0x102c4e4c0,被真实地址0x19d9327f0替换使用
dis -s 0x19d9327f0命令,读取地址中的代码dis -s 0x000000019d9327f0 ------------------------- Foundation`NSLog: 0x19d9327f0 <+0>: sub sp, sp, #0x20 ; =0x20 0x19d9327f4 <+4>: stp x29, x30, [sp, #0x10] 0x19d9327f8 <+8>: add x29, sp, #0x10 ; =0x10 0x19d9327fc <+12>: adrp x8, 311278 0x19d932800 <+16>: ldr x8, [x8, #0xb70] 0x19d932804 <+20>: ldr x8, [x8] 0x19d932808 <+24>: str x8, [sp, #0x8] 0x19d93280c <+28>: add x8, x29, #0x10 ; =0x10
- 指向
NSLog代码
案例3
查看交换后的函数地址
承接
案例2,断点向下执行
在
lldb中,使用程序首地址 + 偏移地址,找到NSLog交换后的函数地址
- 原本
NSLog的真实地址为0x19d9327f0,交换后变为0x102c4d57c使用
dis -s 0x102c4d57c命令,读取地址中的代码dis -s 0x102c4d57c ------------------------- fishhookDemo`my_NSLog: 0x102c4d57c <+0>: sub sp, sp, #0x30 ; =0x30 0x102c4d580 <+4>: stp x29, x30, [sp, #0x20] 0x102c4d584 <+8>: add x29, sp, #0x20 ; =0x20 0x102c4d588 <+12>: sub x8, x29, #0x8 ; =0x8 0x102c4d58c <+16>: mov x9, #0x0 0x102c4d590 <+20>: stur x9, [x29, #-0x8] 0x102c4d594 <+24>: str x0, [sp, #0x10] 0x102c4d598 <+28>: mov x0, x8指向
my_NSLog代码由此可见,
HOOK外部的C函数,本质就是在修改符号和地址的对应关系
符号绑定的过程
Symbol Table:符号表,⽤来保存符号String Table:字符串表,⽤来保存符号的名称Indirect Symbol Table:间接符号表,保存使⽤的外部符号。更准确⼀点就是使⽤的外部动态库的符号。是Symbol Table的子集代码中的函数名、变量名、方法名,在项目编译后,都会生成一张符号表。符号之间也有差别,分为内部符号和外部符号
内部符号是当前
MachO中的符号,而外部符号又称为间接符号,例如:系统库、动态库中的符号
符号按可见性划分,分为全局符号和本地符号
- 全局符号对整个项目可见
- 本地符号仅对当前文件可见
案例1:
符号绑定的过程
打开
ViewController.m文件,写入以下代码:#import "ViewController.h" @implementation ViewController - (void)viewDidLoad { [super viewDidLoad]; NSLog(@"第一次外部函数的调用!"); NSLog(@"第二次外部函数的调用!"); } @end真机运行项目,来到
viewDidLoad方法:
- 两次
NSLog的指令都是bl 0x1022ba4d8使用
image list命令,找到程序虚拟内存的首地址
- 首地址:
0x1022b4000使用
NSLog地址 - 首地址计算偏移地址
- 偏移地址:
0x64d8打开
MachO文件,找到偏移地址为0x64d8的位置
- 处于
__TEXT,__stubs中__stubs:符号桩,本质上就是一段代码,用于跳转到懒加载符号表中,找到对应符号的值0x64d8即是NSLog的桩在
fishHook原理探究中,多次提到跳转到占位地址,这种说法并不准确。真实的情况是,会跳转到外部符号的桩,本质上就是一段代码
案例2:
查看桩对应的代码
查看
MachO文件,找到桩对应的值
1F2003D530D9025800021FD6:以二进制指令的形式存储的代码单步调试,来到
NSLog函数
使用
x 0x1022ba4d8命令,读取地址中的值,以二进制形式显示
1F2003D530D9025800021FD6,和MachO中对应的指令一致有此可见,
1F2003D530D9025800021FD6对应的就是上述三句汇编代码
案例3:
三句汇编代码的含义?
断点执行到
br x16指令
br指令:跳转到x16寄存器存储的地址查看
x16寄存器存储的地址,再减去ASLR偏移地址
- 得到地址:
0x10000658c查看
MachO文件,找到0x10000658c地址
- 指向懒加载符号表中
NSLog符号的值三句汇编代码的含义:找到懒加载符号表中的地址去执行
案例4:
懒加载符号表中的地址,指向的代码是什么?
在
MachO中,找到偏移地址0x658c,指向__TEXT,__stubs_helper中的代码
b指令,跳转到偏移地址为0x6574的位置执行代码在
MachO中,找到偏移地址为0x6574的位置
x16寄存器,偏移地址为0x8000br指令,跳转到偏移地址为0x8000位置执行代码在
MachO中,找到偏移地址为0x8000的位置
- 处于非懒加载符号表中
- 执行
dyld_stub_binder函数,用于符号绑定懒加载符号表中的地址,指向寻找并执行
dyld_stub_binder函数的代码
案例5:
dyld_stub_binder也是外部函数,它的地址是如何找到的?在
MachO中,可以看到dyld_stub_binder函数的偏移地址为0x8000,但全是0,说明此时还没有值
dyld_stub_binder函数,同样是外部函数,存储在非懒加载表中当
dyld加载主程序时,会绑定非懒加载符号和弱引用符号,所以dyld_stub_binder函数的值,在程序启动时被dyld直接绑定真机运行项目,读取
首地址 + 0x8000地址中的值
使用
dis -s 0x19c2e6f94命令,读取地址中的代码libdyld.dylib`dyld_stub_binder: 0x19c2e6f94 <+0>: stp x29, x30, [sp, #-0x10]! 0x19c2e6f98 <+4>: mov x29, sp 0x19c2e6f9c <+8>: sub sp, sp, #0xf0 ; =0xf0 0x19c2e6fa0 <+12>: stp x0, x1, [x29, #-0x10] 0x19c2e6fa4 <+16>: stp x2, x3, [x29, #-0x20] 0x19c2e6fa8 <+20>: stp x4, x5, [x29, #-0x30] 0x19c2e6fac <+24>: stp x6, x7, [x29, #-0x40] 0x19c2e6fb0 <+28>: stp x8, x9, [x29, #-0x50]
案例6:
NSLog函数,首次加载和非首次加载的区别真机运行项目,首次加载
NSLog函数
- 先找到桩里面的代码
- 找到懒加载符号表中的地址去执行
- 指向
__stubs_helper中的代码- 寻找并执行
dyld_stub_binder函数- 符号表重绑定
再次加载
NSLog函数
- 找到桩里面的代码
- 找到懒加载符号表中的地址去执行
- 首次加载
NSLog函数,懒加载符号表中的地址,因重绑定而修改- 修改后的值,直接指向
NSLog函数的真实地址
通过符号找到字符串
fishHook提供的rebinding结构体,其中name为需要HOOK的函数名称作用:当找到相应的符号,再通过符号找到字符串,然后和
name进行字符串比较,如果匹配成功,则替换函数指针
案例1:
通过懒加载符号表中的符号,找到间接符号表中的相同符号,再找到符号对应的值
__la_symbol_ptr懒加载符号表中的符号和顺序,跟间接符号表一致
在
Dynamic Symbol Table中,找到NSLog的值
案例2:
间接符号表中
NSLog的值为0xB8,转为10进制为184
184对应的是此符号在符号总表中的角标在
Symbol Table中,通过角标找到符号,再找到String Table Index的值
案例3:
符号表中
NSLog的String Table Index值为0xCE,表示在字符串表中的偏移地址在
String Table中,找到首地址
首地址:0x11230通过
首地址 + 偏移值 = 0x112FE,找到对应字符串
_是函数的开始,.是分隔符 。5F从_开始,往后读取_NSLog,遇到分隔符结束
总结
HOOK
- 钩子,改变程序执行流程的一种技术
Method Swizzle
利用OC运行时的特性,修改SEL和IMP的对应关系,达到对OC方法HOOK的目的
IMP,本质上是函数指针method_exchangeImplementations:交互两个IMPclass_replaceMethod:替换某个SEL的IMP,如果没有该方法,使用class_addMethod添加method_getImplementation、method_setImplementation:获取和设置某个方法的IMP,很多三方框架都使用这种方式
fishHook
MachO文件的加载原理,动态修改懒加载和非懒加载两张符号表- 可以
HOOK系统函数,但是无法HOOK自定义函数
fishHook原理解析
- 共享缓存:
iOS系统有一块特殊的位置,存放公用动态库。即:动态库共享缓存(dyld shared cache)PIC技术:由于外部函数调用,在编译时期无法确定内存地址。苹果采用PIC技术(位置独立代码),在MachO文件的DATA段,建立懒加载和非懒加载两张符号表,里面存放执行外部函数的指针符号绑定过程
- 外部函数调用,先找到桩里面的代码,
__TEXT,__stubs- 找到懒加载符号表中的地址去执行
外部函数,首次加载
- 懒加载符号表中的地址,指向
__TEXT,__stubs_helper中的代码- 通过代码寻找并执行
dyld_stub_binder函数- 作用:符号表重绑定
外部函数,非首次加载
- 懒加载符号表中的地址,因重绑定而修改
- 修改后的值,直接指向外部函数的真实地址
dyld_stub_binder函数
- 存储在非懒加载符号表中
- 当
dyld加载主程序时,符号被dyld直接绑定通过符号找到字符串
fishHook利用Lazy Symbol Table→Indirect Symbol Table→Symbol Table→String Table,通过重绑定修改指针的值达到HOOK目的


































