引言
1.一般我们都知道app
的启动都是从main
函数开始的,但其实在main
函数之前系统做了一些其他的工作。实际上我们的应用从磁盘加载到内存是通过dyld
来加载。最后会返回主程序的main
函数地址
2.dyld
的概述:(the dynamic link editor
)是苹果的动态链接器,是苹果操作系统一个重要组成部分,在系统内核做好程序准备工作之后,交由dyld负责余下的工作。也就是内核读取完MachO
的Header
之后,就交给DYLD
了
3.dyld源码
4.objc源码
Dyld加载流程图
在正式开始分析之前,我先放出一张总体的流程,这样可以从全局了解整个流程
找到dyld入口
拿到源码,大家可能不知道如何开始分析,首先我们运行一个空项目模拟app启动过程,如下图在load
方法打断点,可以看到函数调用栈,最后调用_dyld_start
方法,
打开
dyld
源码找到通过命名空间dyldbootstrap
找到了start
函数
_dyld_start
下面是start函数实现
在
start
主要作用:
-
rebaseDyld(dyldsMachHeader)
计算ASLR(随机地址) - 栈溢出保护(为堆栈canary设置随机值)
__guard_setup(apple)
- 调用
_dyld_main
_dyld_main 函数
进入main函数,如下图,不到800行代码main函数代码还是很多的,主要可以细分为如下流程:
配置环境变量
加载共享缓存
dyld2 和 dyld3判断
主程序实例化
插入动态库
link主程序、绑定符号
执行初始化方法
return主程序main地址
配置环境变量
从环境中获取主可执行文件的cdHash
获取主程序的版本、架构等信息
检测设置
checkEnvironmentVariables(envp)
检查设置环境变量defaultUninitializedFallbackPaths(envp)
设置环境遍历默认值DYLD_PRINT_OPTS
、 DYLD_PRINT_ENV
在xcode设置这两个变量会打印相关参数、环境变量信息加载共享缓存
共享缓存
:实际上就是像我们UIKit
Foundation
,也就是系统级别的动态库,因为每个app都会用到,苹果为了优化app,就会把这些库放到一些公共的区域了,我们称之为共享缓存
,这样的好处就是对于一些公共的库,不用每个app都去加载。
checkSharedRegionDisable
检查是否开启共享缓存mapSharedCache
加载共享缓存库,如果是第一次加载,就去加载。一般如果其他应用加载过,就不用加载,大大优化了app启动时间
dyld2 、dyld3判断
苹果后面的版本对采用dyld3(闭包)方式加载,但是加载的原理基本不变主程序初始化
通过
instantiateFromLoadedImage
方法初始化一个ImageLoader
对象,sMainExecutable
插入动态库
如上图通过遍历
DYLD_INSERT_LIBRARIES
环境变量,调用loadInsertedDylib
插入动态库
链接主程序
设置
llinkingMainExecutable = true
调用link
方法开始链接主程序
链接动态库
遍历
sAllImages
数组插入动态库,绑定注册信息。由于数组的第一个是主程序所以i+1
符号绑定
通过
recursiveBindWithAccounting
递归绑定主程序遍历绑定插入的动态库
recursiveBind
执行初始化方法
initializeMainExecutable
主程序初始化,其主要是会遍历调用runInitializers
方法然后进入
processInitializers
,为初始化做准备调用
recursiveInitialization
递归初始化后进入notifySingle
根据上面空项目的函数调用栈我们发现,调用完
notifySingle
会调用load_image
方法,但是我们发现并没有找到,但是在notifySingle
方法里面我们看到了sNotifyObjCInit
通知oc方法的一个回调sNotifyObjCInit
回调是通过registerObjCNotifiers
传入了搜索源码
registerObjCNotifiers
发现一个非常关键的方法,也就是dyld
和objc
沟通的桥梁_dyld_objc_notify_register
然后我们打开
objc
源码,搜索_dyld_objc_notify_register
,发现在_objc_init
调用了,也就是注册了通知让后通知最后调用了
load_images
这个方法这个方法主要调用
call_load_methods
,然后循环遍历调用类的load和分类的load方法上面主要是
dyld
调用objc
的流程,回到dyld
源码的main
通过
LC_Main
拿到main
地址并返回所以从上面的流程可以看出,类的load
和分类的load
方法是比主程序的main
方法更早调调用的。