如何检查卡顿?
1、将创建好的观察者 runLoopObserver 添加到主线程 RunLoop 的 common 模式下观察。
2、然后,创建一个持续的子线程专门用来监控主线程的 RunLoop 状态。
3、一旦发现进入睡眠前的 kCFRunLoopBeforeSources 状态,或者唤醒后的状态 kCFRunLoopAfterWaiting,在设置的时间阈值内一直没有变化,即可判定为卡顿。接下来,我们就可以 dump 出堆栈的信息,从而进一步分析出具体是哪个方法的执行时间过长。
RunLoop 是用来监听输入源,进行调度处理的。RunLoop 的目的是,当有事件要去处理时保持线程忙,当没有事件要处理时让线程进入休眠。
进入休眠后,会等待 mach_port 的消息,以再次唤醒。只有在下面四个事件出现时才会被再次唤醒:
基于 port 的 Source 事件、Timer 时间到、RunLoop 超时、被调用者唤醒。
RunLoop 被唤醒后就要开始处理消息了:
如果是 Timer 时间到的话,就触发 Timer 的回调、如果是 dispatch 的话,就执行 block、如果是 source1 事件的话,就处理这个事件
卡顿的时间阈值设置多少合适?
触发卡顿的时间阈值,单位是秒。可以看到,我们把这个阈值设置成了 3 秒。那么,这个 3 秒的阈值是从何而来呢?可以把启动的阈值设置为 10 秒,其他状态则都默认设置为 3 秒。总的原则就是,要小于 WatchDog 的限制时间。
触发卡顿的时间阈值,我们可以根据 WatchDog 机制来设置。WatchDog 在不同状态下设置的不同时间,如下所示:
启动(Launch):20s;
恢复(Resume):10s;
挂起(Suspend):10s;
退出(Quit):6s;后台(Background):
3min(在 iOS 7 之前,每次申请 10min; 之后改为每次申请 3min,可连续申请,最多申请到 10min)。
iOS常见卡顿问题总结:
1、NSUserDefaults:低内存情况下,系统拷贝内存数据到磁盘,NSUserDefaults组件会在系统低内存时会把内存中的数据进行置换,执行的过程中会加把锁,此时主线程访问NSUserDefaults就会长时间卡顿
2、I/O操作:文件读写,数据库操作
3、系统接口:获取mac地址、切换音频设备
4、锁以及死锁的滥用,操作数据比较频繁的时候使用互斥锁会影响性能,使用自旋锁会好一些
5、排版绘制:sizeWithFont、[EAGLContext setCurrentContext:]
6、GCD并发队列短时间创建大量任务
7、UIWebView初始化,销毁 (使用性能更优的WKWebView)
监控卡顿方法的优化:
第一版:
OC入口方法Hook
Hook objc_msgsend、NSNotification、NSTimer、performSelector OC函数入口,在主线程调用所有的OC方法的时候,去把OC方法的耗时调用打印出来
缺点:
1、它提供的信息太少了,只有一个耗时的方法,比如说I/O操作当然会卡,但是没法知道上层是谁调用的
2、只能hook OC的方法,对于C、C++的卡顿是没办法覆盖的
第二版
基于Runloop observer抓栈监控方案
核心思想:在所有runloop的入口和出口都打上一个标记,这样就知道每一个runloop循环的耗时,然后再在一个子线程利用NSTimer定时抓取主线程的堆栈,这样卡顿的时候,我们分析堆栈信息就知道卡在哪里了
缺点:
假设有些耗时的方法,也是通过observer注册到runloop里面去,它的执行顺序又在我们注册的observer之后,这部分的observer发生的耗时操作就监控不到了
最常见的例子就是,UI刷新的回调,系统其实会在每个runloop迭代结束之后呢用observer的方式执行一次UI刷新操作,有些耗时操作发生在UI刷新的回调里面,有可能就监控不到了
第三版
1、基于CADisplayLink回调的抓栈监控方案 : 主线程监听CADisplayLink屏幕刷新回调,子线程利用CADisplayLink回调抓取堆栈,CADisplayLink是系统提供的刷新的一个回调
2、首先在主线程注册一个CADisplayLink,然后我们就可以知道每一次主线程UI刷新的回调,在创建一个优先级比较高的子线程注册一个CADisplayLink,在这个子线程只做一件事,就是不断的抓取主线程的堆栈,比如说主线程卡顿了1000毫秒,这个子线程就可以抓取60帧的堆栈,就可以去观察每个函数调用的时间
方案优势:
1、屏幕刷新回调,保证所有的卡顿都不会遗漏
2、CADisplayLink硬件事件回调,相比NSTimer更加精准无延时
3、子线程抓取堆栈,抓取效率高
堆栈抓取原理:
在抓取之前把主线程挂起(suspend),挂起之后获取到主线程的FP寄存器,然后回溯,获取到完整的函数返回地址,也就是我们要的主线程堆栈
注意点:
1、内存分配可能引发的死锁,这是因为在抓取之前会挂起主线程,这时候如果主线程正在分配内存,内存分配在底层会有一个锁,如果主线程刚到拿到锁,我们又把它挂起了,就会导致死锁,解决方案就是先分配好内存,保证在子线程回溯的过程中不会有内存分配
2、因为每隔16.7ms就抓取一下所有线程堆栈,对性能的影响会非常大,卡顿一般只抓取主线程,超过5秒抓一次全部线程堆栈
参看资料:https://time.geekbang.org/dailylesson/detail/100032617>