IOS APP 启动优化记录

问题,APP启动慢,从启动到展示主页面视图需要5秒以上。

首先,研究APP启动流程。

优化方向,main函数之前和main函数之后。

1.mach-O

哪些名词指的是Mach-O

Executable 可执行文件

Dylib 动态库

Bundle 无法被连接的动态库,只能通过dlopen()加载

Image 指的是Executable,Dylib或者Bundle的一种,文中会多次使用Image这个名词。

Framework 动态库和对应的头文件和资源文件的集合

Apple出品的操作系统的可执行文件格式几乎都是mach-O,iOS当然也不例外。mach-o可以大致分为三部分:

1

Header头部,包含可以执行的CPU架构,比如x86,arm64

Load commands 加载命令,包含文件的组织架构和在虚拟内存中的布局方式

Data,数据,包含load commands中需要的各个段(segment)的数据,每个Segment的大小都是Page的整数倍。

我们用MachOView打开Demo工程的可以执行文件,来验证下mach-o的文件布局:


MachOView中的文件布局

那么Data部分又包含那些segment呢?绝大多数mach-o包括以下三个阶段(支持用户自定义Segment,但是很少使用)

__TEXT代码段,只读,包含函数,和只读的字符串,上图中类似__TEXT,__text的都是代码段

__Data数据段,读写,包括可读写的全局变量等,__DATA,__data都是数据段

__LINKEDIT包含了方法和变量的元数据(位置,偏移量),以及代码签名等信息。

关于mach-o更多细节,可以看看文档:《Mac OS X ABI Mach-O File Format Reference

2.dyld

dyld的全称是dynamic loader,它的作用是加载一个进程所需要的image,dyld是开源的

3.Virtual Memory

虚拟内存是在物理内存上建立的一个逻辑地址空间,它向上(应用)提供了一个连续的逻辑地址空间,向下隐藏了物理内存的细节。

虚拟内存使得逻辑地址可以没有实际的物理地址,也可以让多个逻辑地址对应到一个物理地址。

虚拟内存被划分为一个个大小相同的Page(64位系统上是16KB),提高管理和读写的效率。 Page又分为只读和读写的Page。

4.Page fault

在应用执行的时候,它被分配的逻辑地址空间都是可以访问的,当应用访问一个逻辑Page,而在对应的物理内存中并不存在的时候,这时候就发生了一次Page fault。当Page fault发生的时候,会中断当前的程序,在物理内存中寻找一个可用的Page,然后从磁盘中读取数据到物理内存,接着继续执行当前程序。

5.Dirty Page & Clean Page

如果一个Page可以从磁盘上重新生成,那么这Page称为Clear Page

如果一个Page包含了进程相关信息,那么这个Page称为Dirty Page

像代码段这种只读的Page就是Clean Page。而数据段(__DATA)这种读写的Page,当写数据发生的时候,会触发CO(Copy on write),也就是写时复制,Page会被标记成Dirty,同时会被复制。

想要了解更多细节,可以阅读文档:Memory Usage Performance Guidelines

6.启动过程

使用dyld2启动应用的过程如图:


iOS应用启动过程

大致的过程如下:

加载dyld到App进程

加载动态库(包括所依赖的所有动态库)

Rebase

Bind

初始化Objective C Runtime

其它的初始化代码

(1)加载动态库

dyld会首先读取mach-o文件的Header和load commands。

接着就知道了这个可执行文件依赖的动态库。例如加载动态库A到内存,接着检查A所依赖的动态库,就这样的递归加载,直到所有的动态库加载完毕。通常一个App所依赖的动态库在100-400个左右,其中大多数都是系统的动态库,它们会被缓存到dyld shared cache,这样读取的效率会很高。

查看mach-o文件所依赖的动态库,可以通过MachOView的图形化界面(展开Load Command就能看到),也可以通过命令行otool。

(2)Rebase && Bind

这里先来讲讲为什么要Rebase?

有两种主要的技术来保证应用的安全:ASLR和Code Sign。

ASLR的全称是Address space layout randomization,翻译过来就是“地址空间布局随机化”。App被启动的时候,程序会被影射到逻辑的地址空间,这个逻辑的地址空间有一个起始地址,而ASLR技术使得这个起始地址是随机的。如果是固定的,那么黑客很容易就可以由起始地址+偏移量找到函数的地址。

Code Sign相信大多数开发者都知晓,这里要提一点的是,在进行Code sign的时候,加密哈希不是针对于整个文件,而是针对于每一个Page的。这就保证了在dyld进行加载的时候,可以对每一个page进行独立的验证。

mach-o中有很多符号,有指向当前mach-o的,也有指向其他dylib的,比如printf。那么,在运行时,代码如何准确的找到printf的地址呢?

mach-o中采用了PIC技术,全称是Position Independ code。当你的程序要调用printf的时候,会先在__DATA段中建立一个指针指向printf,在通过这个指针实现间接调用。dyld这时候需要做一些fix-up工作,即帮助应用程序找到这些符号的实际地址。主要包括两部分

Rebase 修正内部(指向当前mach-o文件)的指针指向

Bind 修正外部指针指向


Rebase && Bind

之所以需要Rebase,是因为刚刚提到的ASLR使得地址随机化,导致起始地址不固定,另外由于Code Sign,导致不能直接修改Image。Rebase的时候只需要增加对应的偏移量即可。待Rebase的数据都存放在__LINKEDIT中。

可以通过MachOView查看:Dynamic Loader Info -> Rebase Info

Rebase解决了内部的符号引用问题,而外部的符号引用则是由Bind解决。在解决Bind的时候,是根据字符串匹配的方式查找符号表,所以这个过程相对于Rebase来说是略慢的。

同样,也可以通过xcrun dyldinfo来查看Bind的信息,比如我们查看bind信息中。

(3)Objective C

Objective C是动态语言,所以在执行main函数之前,需要把类的信息注册到一个全局的Table中。同时,Objective C支持Category,在初始化的时候,也会把Category中的方法注册到对应的类中,同时会唯一Selector,这也是为什么当你的Cagegory实现了类中同名的方法后,类中的方法会被覆盖。

另外,由于iOS开发时基于Cocoa Touch的,所以绝大多数的类起始都是系统类,所以大多数的Runtime初始化起始在Rebase和Bind中已经完成。

(4)Initializers

接下来就是必要的初始化部分了,主要包括几部分:

+load方法。

C/C++静态初始化对象和标记为attribute(constructor)的方法

这里要提一点的就是,+load方法已经被弃用了,如果你用Swift开发,你会发现根本无法去写这样一个方法,官方的建议是实用initialize。区别就是,load是在类装载的时候执行,而initialize是在类第一次收到message前调用。

dyld3

上文的讲解是dyld2的加载方式。而最新的是dyld3加载方式略有不同:


dyld2和dyld3的区别

dyld2是纯粹的in-process,也就是在程序进程内执行的,也就意味着只有当应用程序被启动的时候,dyld2才能开始执行任务。

dyld3则是部分out-of-process,部分in-process。图中,虚线之上的部分是out-of-process的,在App下载安装和版本更新的时候会去执行,out-of-process会做如下事情:

分析Mach-o Headers

分析依赖的动态库

查找需要Rebase & Bind之类的符号

把上述结果写入缓存

这样,在应用启动的时候,就可以直接从缓存中读取数据,加快加载速度。

7.启动时间

(1)冷启动 VS 热启动

如果你刚刚启动过App,这时候App的启动所需要的数据仍然在缓存中,再次启动的时候称为热启动。如果设备刚刚重启,然后启动App,这时候称为冷启动。

启动时间在小于400ms是最佳的,因为从点击图标到显示Launch Screen,到Launch Screen消失这段时间是400ms。启动时间不可以大于20s,否则会被系统杀掉。

在Xcode中,可以通过设置环境变量来查看App的启动时间,DYLD_PRINT_STATISTICS和DYLD_PRINT_STATISTICS_DETAILS。


1

Total pre-main time: 43.00 milliseconds (100.0%)

        dylib loading time:  19.01 milliseconds (44.2%)

        rebase/binding time:  1.77 milliseconds (4.1%)

            ObjC setup time:  3.98 milliseconds (9.2%)

          initializer time:  18.17 milliseconds (42.2%)

          slowest intializers :

            libSystem.B.dylib :  2.56 milliseconds (5.9%)

  libBacktraceRecording.dylib :  3.00 milliseconds (6.9%)

    libMainThreadChecker.dylib :  8.26 milliseconds (19.2%)

                      ModelIO :  1.37 milliseconds (3.1%)

对于这个libMainThreadChecker.dylib估计很多同学会有点陌生,这是XCode 9新增的动态库,用来做主线成检查的。

(2)优化启动时间

启动时间这个名词,不同的人有不同的定义。在我看来,

启动时间是用户点击App图标,到第一个界面展示的时间。

以main函数作为分水岭,启动时间其实包括了两部分:main函数之前和main函数到第一个界面的viewDidAppear:。所以,优化也是从两个方面进行的,个人建议优先优化后者,因为绝大多数App的瓶颈在自己的代码里。

(3)Main函数之后

我们首先来分析下,从main函数开始执行,到你的第一个界面显示,这期间一般会做哪些事情。

执行AppDelegate的代理方法,主要是didFinishLaunchingWithOptions

初始化Window,初始化基础的ViewController结构(一般是UINavigationController+UITabViewController)

获取数据(Local DB/Network),展示给用户。

(4)UIViewController

延迟初始化那些不必要的UIViewController。

比如网易新闻:在启动的时候只需要初始化首页的头条页面即可。像“要闻”,“我的”等页面,则延迟加载,即启动的时候只是一个UIViewController作为占位符给TabController,等到用户点击了再去进行真正的数据和视图的初始化工作。

(5)AppDelegate

通常我们会在AppDelegate的代理方法里进行初始化工作,主要包括了两个方法:

didFinishLaunchingWithOptions

applicationDidBecomeActive

优化这些初始化的核心思想就是:

能延迟初始化的尽量延迟初始化,不能延迟初始化的尽量放到后台初始化。

这些工作主要可以分为几类:

三方SDK初始化,比如Crash统计; 像分享之类的,可以等到第一次调用再出初始化。

初始化某些基础服务,比如WatchDog,远程参数。

启动相关日志,日志往往涉及到DB操作,一定要放到后台去做

业务方初始化,这个交由每个业务自己去控制初始化时间。

对于didFinishLaunchingWithOptions的代码,建议按照以下的方式进行划分:

@interfaceAppDelegate()

//业务方需要的生命周期回调@property(strong,nonatomic)NSArray<id<UIApplicationDelegate>>*eventQueues;

//主框架负责的生命周期回调

@property(strong,nonatomic)id<UIApplicationDelegate>basicDelegate;

@end

然后,你会得到一个非常干净的AppDelegate文件:

-(BOOL)application:(UIApplication*)application didFinishLaunchingWithOptions:(NSDictionary*)launchOptions{

for(id<UIApplicationDelegate> delegatein self.eventQueues){

[delegate application:application didFinishLaunchingWithOptions:launchOptions];

}

return [self.basicDelegate application:application didFinishLaunchingWithOptions:launchOptions];

}

由于对这些初始化进行了分组,在开发期就可以很容易的控制每一个业务的初始化时间:

CFTimeInterval startTime=CACurrentMediaTime();

//执行方法

CFTimeInterval endTime=CACurrentMediaTime();

(6)用Time Profiler找到元凶

Time Profiler在分析时间占用上非常强大。实用的时候注意三点

在打包模式下分析(一般是Release),这样和线上环境一样。

记得开启dsym,不然无法查看到具体的函数调用堆栈

分析性能差的设备,对于支持iOS 8的,一般分析iphone 4s或者iphone 5。

一个典型的分析界面如下:


2

几点要注意:

分析启动时间,一般只关心主线程

选择Hide System Libraries和Invert Call Tree,这样我们能专注于自己的代码

右侧可以看到详细的调用堆栈信息

在某一行上双击,我们可以进入到代码预览界面,去看看实际每一行占用了多少时间:


3

小结

不同的App在启动的时候做的事情往往不同,但是优化起来的核心思想无非就两个:

能延迟执行的就延迟执行。比如SDK的初始化,界面的创建。

不能延迟执行的,尽量放到后台执行。比如数据读取,原始JSON数据转对象,日志发送。

(7)Main函数之前

Main函数之前是iOS系统的工作,所以这部分的优化往往更具有通用性。

(8)dylibs

启动的第一步是加载动态库,加载系统的动态库使很快的,因为可以缓存,而加载内嵌的动态库速度较慢。所以,提高这一步的效率的关键是:减少动态库的数量。

合并动态库,比如公司内部由私有Pod建立了如下动态库:XXTableView, XXHUD, XXLabel,强烈建议合并成一个XXUIKit来提高加载速度。

(9)Rebase & Bind & Objective C Runtime

Rebase和Bind都是为了解决指针引用的问题。对于Objective C开发来说,主要的时间消耗在Class/Method的符号加载上,所以常见的优化方案是:

减少__DATA段中的指针数量。

合并Category和功能类似的类。比如:UIView+Frame,UIView+AutoLayout…合并为一个

删除无用的方法和类。

多用Swift Structs,因为Swfit Structs是静态分发的。感兴趣的同学可以看看我之前这篇文章:《Swift进阶之内存模型和方法调度

(10)Initializers

通常,我们会在+load方法中进行method-swizzling,这也是Nshipster推荐的方式。

用initialize替代load。不少同学喜欢用method-swizzling来实现AOP去做日志统计等内容,强烈建议改为在initialize进行初始化。

减少__atribute__((constructor))的使用,而是在第一次访问的时候才用dispatch_once等方式初始化。

不要创建线程

使用Swfit重写代码。

参考资料:

WWDC 2016: Optimizing App Startup Time

WWDC 2017: App Startup Time: Past, Present, and Future

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,245评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,749评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,960评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,575评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,668评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,670评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,664评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,422评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,864评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,178评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,340评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,015评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,646评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,265评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,494评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,261评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,206评论 2 352

推荐阅读更多精彩内容

  • App 运行理论 理论速成Mach-O 术语Mach-O 是针对不同运行时可执行文件的文件类型。文件类型:Exec...
    未明一二阅读 546评论 1 3
  • 背景 一个项目做的时间长了,启动流程往往容易杂乱,库也用的越来越多,APP的启动时间也会慢慢变长。本次将针对iOS...
    酱油瓶2阅读 3,508评论 0 12
  • 这是一篇 WWDC 2016 Session 406 的学习笔记,从原理到实践讲述了如何优化 App 的启动时间。...
    茗涙阅读 1,860评论 0 3
  • 前言 启动时间是衡量应用品质的重要指标。 本文首先会从原理上出发,讲解iOS系统是如何启动App的,然后从main...
    荒漠现甘泉阅读 927评论 0 2
  • 深入理解iOS App的启动过程 前言 启动时间是衡量应用品质的重要指标。 本文首先会从原理上出发,讲解iOS系统...
    大维ios阅读 951评论 0 5