一、卡顿优化
- 在屏幕成像的过程中,CPU和GPU起着至关重要的作用。
- CPU(Central Processing Unit,中央处理器)对象的创建和销毁、对象属性的调整、布局计算、文本的计算和排版、图片的格式转换和解码、图像的绘制(Core Graphics)。
- GPU(Graphics Processing Unit,图形处理器)用于纹理的渲染。
-
iOSAPP屏幕显示过程:
CPU计算好显示内容提交到GPU,GPU渲染完成后将渲染结果放入帧缓冲区(在iOS中是双缓冲机制,有前帧缓存、后帧缓存),随后视频控制器会按照 VSync信号逐行读取帧缓冲区的数据,经过可能的数模转换传递给显示器显示。
- RunLoop有一个60fps的回调,即每16.7ms绘制一次屏幕,所以view的绘制必须在这个时间内完成,view内容的绘制是CPU的工作,然后把绘制的内容交给GPU渲染,包括多个View的拼接(Compositing)、纹理的渲染(Texture)等等,最后显示在屏幕上。但是,如果无法是16.7ms内完成绘制,就会出现丢帧的问题,一般情况下,如果帧率保证在30fps以上,界面卡顿效果不明显,那么就需要在33.4ms内完成View的绘制,而低于这个帧率,就会产生卡顿的效果,影响体验。
卡顿优化 -- CPU
- 避免过于庞大的xib,尽量纯代码布局
- 使用懒加载
- 尽量不要在viewWillAppear中进行太多操作
- 尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView。
- 不要频繁地调用UIView的相关属性,比如frame、bounds、transform等属性,尽量减少不必要的修改,必要时提前创建,用hidden属性控制视图的显示和隐藏。
- 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性。
- frame代替autolayout,Autolayout会比直接设置frame消耗更多的CPU资源,Autolayout 对于复杂视图来说常常会产生严重的性能问题,当Cell内约束超过25个的时候,会降低滑动的帧率。
- 图片的size最好刚好跟UIImageView的size保持一致(在运行中缩放图片是很耗费资源的,特别是UIImageView嵌套在UIScrollView中的情况下)
- 控制一下线程的最大并发数量
- 尽量把耗时的操作放到放到后台线程进行以避免阻塞主线程。
- 文本处理(尺寸计算、绘制)
- 图片处理(解码、绘制)
- 使用开源框架
UITableView+FDTemplateLayoutCell
进行对tableView高度缓存
UITableView+FDTemplateLayoutCell
原理:
(1)、计算出高度会自动进行缓存,所以滑动时每个cell的高度只会计算一次
(2)、自动缓存失效机制,无须担心你数据源的变化引起的缓存失效,当调用如-reloadData,-deleteRowsAtIndexPaths:withRowAnimation:等任何一个触发 UITableView 刷新机制的方法时,已有的高度缓存将以最小的代价执行失效。如删除一个 indexPath 为 [0,5] 的 cell 时,[0,0] ~ [0,4] 的高度缓存不受影响,而 [0,5] 后面所有的缓存值都向前移动一个位置。自动缓存失效机制对 UITableView 的 9 个公有 API 都进行了分别的处理,以保证没有一次多余的高度计算。
(3)、利用RunLoop空闲时间执行预缓存任务,预缓存机制将在 UITableView 没有滑动的空闲时刻执行,计算并且缓存那些还没有显示到屏幕中的 cell,整个缓存过程完全没有感知,保证了加载速度和滑动流畅性。它是利用RunLoop空闲时间执行预缓存任务,当 UI 没在滑动时,默认的 Mode 是 NSDefaultRunLoopMode,同时也是 CF 中定义的 “空闲状态 Mode”。注册 RunLoopObserver 可以观测当前 RunLoop 的运行状态,并在状态机切换时收到通知:因为“预缓存高度”的任务需要在最无感知的时刻进行,所以应该同时满足:
1 RunLoop 处于“空闲”状态 Mode(DefauldMode)
2 当这一次 RunLoop 迭代处理完成了所有事件,马上要休眠时 - 预加载数据 ,列表当中,当滑动到一个可以设定的位置的时候,提前获取下载下一页的数据,并绘制UI。 https://zhuanlan.zhihu.com/p/23418800
卡顿优化 -- GPU
- 纹理的渲染
- 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示(当在较短时间显示大量图片时(比如 TableView 存在非常多的图片并且快速滑动时),CPU 占用率很低,GPU 占用非常高,界面仍然会掉帧)
- GPU能处理的最大纹理尺寸是4096x4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸
- 视图的混合(Blended)
- 尽量减少视图数量和层次,也可以把多个视图预先渲染为一张图片来显示(视图结构过于复杂,混合的过程、会消耗很多 GPU 资源)
- 减少透明的视图(alpha<1),不透明的就设置opaque为YES(在同一个区域内,存在着多个有透明度的图层,那么GPU需要更多的计算,混合上下多个图层才能得出最终像素的RGB值)
- 离屏渲染
在OpenGL中,GPU有2种渲染方式- On-Screen Rendering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作
- Off-Screen Rendering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作
离屏渲染之所以会特别消耗性能,是因为要创建一个屏幕外的缓冲区,然后从当屏缓冲区切换到屏幕外的缓冲区,然后再完成渲染;其中,创建缓冲区和切换上下文最消耗性能,而绘制其实不是性能损耗的主要原因。
- 哪些操作会触发离屏渲染?
- 光栅化,设置
layer.shouldRasterize = YES
(在其他属性触发离屏渲染的同时,会将光栅化后的内容缓存起来,如果对应的layer及其sublayers没有发生改变,在下一帧的时候可以直接复用。shouldRasterize = YES,这将隐式的创建一个位图,各种阴影遮罩等效果也会保存到位图中并缓存起来,从而减少渲染的频度 - 遮罩,layer.mask
- 圆角,iOS9之前同时设置layer.masksToBounds = YES、layer.cornerRadius大于0。(考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片)
- 阴影,layer.shadowXXX(如果设置了layer.shadowPath就不会产生离屏渲染)
- 光栅化,设置
卡顿检测
- 平时所说的“卡顿”主要是因为在主线程执行了比较耗时的操作
- 可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以达到监控卡顿的目的。
卡顿检测工具:LXDAppFluecyMonitor
使用方法:
[[LXDAppFluecyMonitor sharedMonitor] startMonitoring];
- 当发生卡顿时,会打印函数调用栈信息
libsystem_kernel.dylib 0x7fff51b5d756 __semwait_signal + 10
libsystem_c.dylib 0x7fff51aed47e sleep + 41
LXDAppFluecyMonitor 0x10e7f81d2 -[ViewController tableView:cellForRowAtIndexPath:] + 354
得知卡顿发生在cellForRowAtIndexPath:
方法中
- 使用
image lookup -a
指令得知卡顿具体发生行数
image lookup -a 0x10e7f81d2
Address: LXDAppFluecyMonitor[0x00000001000031d2] (LXDAppFluecyMonitor.__TEXT.__text + 6530)
Summary: LXDAppFluecyMonitor`-[ViewController tableView:cellForRowAtIndexPath:] + 354 at ViewController.m:47:48
二、耗电优化
耗电的主要来源
- CPU处理,Processing
- 网络,Networking
- 定位,Location
- 图像,Graphics
耗电优化
尽可能降低CPU、GPU功耗
少用定时器
-
优化I/O操作
- 尽量不要频繁写入小数据,最好批量一次性写入
- 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API。用dispatch_io系统会优化磁盘访问
- 数据量比较大的,建议使用数据库(比如SQLite、CoreData)
-
网络优化
- 减少、压缩网络数据
- 如果多次请求的结果是相同的,尽量使用缓存
- 使用断点续传,否则网络不稳定时可能多次传输相同的内容
- 网络不可用时,不要尝试执行网络请求
- 让用户可以取消长时间运行或者速度很慢的网络操作,设置合适的超时时间
- 批量传输,比如,下载视频流时,不要传输很小的数据包,直接下载整个文件或者一大块一大块地下载。如果下载广告,一次性多下载一些,然后再慢慢展示。如果下载电子邮件,一次下载多封,不要一封一封地下载
-
定位优化
- 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法。定位完成后,会自动让定位硬件断电
- 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务
- 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
- 需要后台定位时,尽量设置
pausesLocationUpdatesAutomatically
为YES,如果用户不太可能移动的时候系统会自动暂停位置更新 - 尽量不要使用
startMonitoringSignificantLocationChanges
,优先考虑startMonitoringForRegion:
-
硬件检测优化
- 用户移动、摇晃、倾斜设备时,会产生动作(motion)事件,这些事件由加速度计、陀螺仪、磁力计等硬件检测。在不需要检测的场合,应该及时关闭这些硬件
三、 启动优化
APP的启动可以分为2种,APP启动时间的优化,主要是针对冷启动进行优化
- 冷启动(Cold Launch):从零开始启动APP
- 热启动(Warm Launch):APP已经在内存中,在后台存活着,再次点击图标启动APP
通过添加环境变量可以打印出APP的启动时间分析(Edit scheme -> Run -> Arguments)
- DYLD_PRINT_STATISTICS设置为1
- 如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1
APP的冷启动可以概括为3大阶段:
1、 dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等),启动APP时,dyld所做的事情有
- 装载APP的可执行文件,同时会递归加载所有依赖的动态库
- 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步的处理
2、 runtime启动APP时,runtime所做的事情有
- 调用map_images进行可执行文件内容的解析和处理
- 在load_images中调用call_load_methods,调用所有Class和Category的+load方法
- 进行各种objc结构的初始化(注册Objc类 、初始化类对象等等)
- 调用C++静态初始化器和
__attribute__((constructor))
修饰的函数
到此为止,可执行文件和动态库中所有的符号(Class,Protocol,Selector,IMP,…)都已经按格式成功加载到内存中,被runtime 所管理
3、 main
APP的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库,并由runtime负责加载成objc定义的结构
所有初始化工作结束后,dyld就会调用main函数
接下来就是UIApplicationMain
函数,AppDelegate的application:didFinishLaunchingWithOptions:
方法。
APP的启动优化
按照不同的阶段
- dyld
- 减少动态库、合并一些动态库(定期清理不必要的动态库)
- 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)
- 减少C++虚函数数量
- Swift尽量使用struct
- runtime
- 用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、ObjC的+load
- main
- 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中
- 按需加载
四、安装包优化
安装包(IPA)主要由可执行文件、资源组成
1. 资源(图片、音频、视频等)
- 采取无损压缩
好用的压缩图片网站:https://tinypng.com - 去除没有用到的资源: https://github.com/tinymind/LSUnusedResources
2. 可执行文件瘦身
-
编译器优化
- Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default设置为YES
- 去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other C Flags添加-fno-exceptions
AppCode代码静态检查(https://www.jetbrains.com/objc/),检测未使用的代码:菜单栏 -> Code -> Inspect Code
-
使用fui(Find Unused Imports)扫描工程中不用的类。
安装 fui 工具 sudo gem install fui -n /usr/local/bin fui usage: https://github.com/dblock/fui 到工程目录下,执行 fui find 命令,可以找出所有的没有用到的class文件
合并功能类似的类和扩展(Category)
-
LinkMap
生成LinkMap文件,可以查看可执行文件的具体组成
可借助第三方工具解析LinkMap文件: https://github.com/huanxsd/LinkMap 及时移除不用的第三方库
删除静态库中不用的mach-o文件
- 利用lipo指令将静态库拆分成单一架构
- 利用ar-x指令将单一架构的mach-o文件拆分成.o文件
- 删除不用的.o文件
- 重新组成静态库文件
五、内存优化
-
imageNamed
读取图片的方法,会缓存在内存中,所以较大的图片或者不需要缓存的图片,还是用imageWithContentsOfFile
加载 - 避免循环引用
- malloc、create等需要手动释放
- kvo及时移除
- Autorelease Pool的使用
由于自动释放池最后统一销毁对象,因此如果一个操作比较占用内存,例如:对象较多或者对象占用资源较多,最好不要放到自动释放池或者放到多个自动释放池;
例如:使用容器的block版本的枚举器的时候,系统会自动添加一个autoreleasePool[array enumerateObjectsUsingBlock:^(id obj,NSUInteger idx, BOOL *stop) { // 这里被一个局部@autoreleasepool包围着 }];
- 利用runtime,hook
delloc
方法监控页面释放