一、CPU 和 GPU
在屏幕成像的过程中,CPU和GPU起着至关重要的作用。
-
CPU(Central Processing Unit,中央处理器)主要作用:
- 对象的创建和销毁
- 对象属性的调整
- 布局计算
- 文本的计算和排版
- 图片的格式转换和解码
- 图像的绘制(Core Graphics)
-
GPU(Graphics Processing Unit,图像处理器主要作用:
- 纹理渲染
在屏幕成像的流程是:CPU -> GPU -> 缓冲区 -> 屏幕
CPU 通过计算 将要显示的数据 提交给GPU
GPU通过渲染后,提前放到帧缓冲区,等着显示在屏幕上
然后显示到屏幕上;
二、卡顿优化
一、首先说一下屏幕卡顿的原因
- iOS设备的硬件时钟会发出Vsync(垂直同步信号)
- 然后App的CPU会计算屏幕要显示的内容
- 随后把计算好的内容提交互GPU去纹理渲染
- 随后GPU将渲染结果提交到帧缓冲区
- 随后等到下一个Vsync到来时将缓冲区的帧显示到屏幕上。
一帧图像的显示是由CPU和GPU共同决定的,一般来说,页面滑动流畅是60fps,也就是一秒有60帧更新,即每隔16.7ms就要产生一帧画面,
由于垂直同步的机制,如果CPU和GPU加起来的处理时间超过了16.7ms,CPU 或者 GPU 没有完成内容提交,则那一帧就会被丢弃,等待下一次机会再显示.而这时显示屏会保留之前的内容不变。这就是界面卡顿的原因。
所有优化CPU和GPU是减少卡顿的原因。
二、卡顿优化-CPU优化
- 尽量用轻量级的对象,比如用不到事件处理的地方,可以考虑使用CALayer取代UIView;
- 不要频繁地调用UIView的相关属性,比如frame、bounds、transform等属性,尽量减少不必要的修改;
- 尽量提前计算好布局,在有需要时一次性调整对应的属性,不要多次修改属性;
- AutoLayout会比直接设置frame消耗更多的CPU资源;
- 图片的size最好刚好跟UIImageView的size保持一致;
- 控制一下线程的最大并发数量;
- 尽量把耗时的操作放到子线程
- 文本处理(尺寸计算、绘制)
- 图片处理(解码、绘制)
三、卡顿优化-GPU优化
- 尽量避免短时间内大量图片的显示,尽可能将多张图片合成一张进行显示
- GPU能处理的最大纹理尺寸是4096*4096,一旦超过这个尺寸,就会占用CPU资源进行处理,所以纹理尽量不要超过这个尺寸。
- 尽量减少视图数量和层次
- 减少透明的视图(alpha<1),不透明的就设置opaque为YES;
- 尽量避免出现离屏渲染
四、离屏渲染
在OpenGL中,GPU有2种渲染方式:
- On-Screen Readering:当前屏幕渲染,在当前用于显示的屏幕缓冲区进行渲染操作。
- Off-Screen Readering:离屏渲染,在当前屏幕缓冲区以外新开辟一个缓冲区进行渲染操作。
离屏渲染消耗性能的原因:
- 需要创建新的缓冲区
- 离屏渲染的整个过程,需要多次切换上下文环境,先是从当前屏幕(On-Screen)切换到离屏(Off-Screen);
- 等到离屏渲染结束后,将离屏缓冲区的渲染结果显示到屏幕上,又需要将上下文环境从离屏切换到当前屏幕;
哪些操作会触发离屏渲染?
- 光栅化, layer.shouldRasterize = YES;
- 遮罩,layer.mask
- 圆角 同时设置(layer.masksToBounds = YES; layer.cornerRadius > 0)
- 考虑通过CoreGraphics绘制裁剪圆角,或者叫美工提供圆角图片
- 阴影,layer.shadowXXX
- 如果设置了layer.shadowPath就不会产生离屏渲染
三、卡顿检测
- 平时所说的卡顿主要是因为在主线程执行了比较耗时的操作
- 可以添加Observer到主线程RunLoop中,通过监听RunLoop状态切换的耗时,以过到监控卡顿的目的;
四、 App启动优化
1、App的启动可以分为2种:
- 冷启动(Cold Launch):从零开始启动App
- 热启动(Warm Launch):App已经在内存中并且还在后台存活着,再次点击图标启动App
App启动时间的优化,主要是针对冷启动进行优化
2.优化前,先分析启动时间
- 通过Xcode -> Edit scheme -> Run -> Arguments添加环境变量,可以打印出App的启动时间分析
- DYLD_PRINT_STATISTICS 设置为1
- 如果需要更详细的信息,那就将DYLD_PRINT_STATISTICS_DETAILS设置为1
3. App的冷启动可以概括为3大阶段
1、dyld
dyld(dynamic link editor),Apple的动态链接器,可以用来装载Mach-O文件(可执行文件、动态库等)
启动App,dyld需要做的事情有:
* 装载App的可执行文件,同时会递归加载所有依赖的动态库
* 当dyld把可执行文件、动态库都装载完毕后,会通知Runtime进行下一步处理
2、runtime
启动App时,runtime所做的事情有:
- 调用map_images进行可执行文件内容的解析和处理
- 在load_images中调用call_load_mehthods, 调用所有Class和Category的+load方法
- 进行各种obj结构的初始化(注册Objc类、初始化类对象等等)
- 调用C++静态初始化器和attribute_((constructor))修饰的函数;
- 到此为止,可执行文件和动态库中所有的符号(class, Protocol, Selector, IMP,... )都已经按格式成功加载到内存中,被runtime所管理。
3、main函数
总结一下:
- App的启动由dyld主导,将可执行文件加载到内存,顺便加载所有依赖的动态库
- 并由runtime负责加载成objc定义的结构
- 所有初始化工作结束后,dyld就会调用main函数
- 接下来就是UIApplicationMain函数,AppDelegate的application:didFinishLaunchingWithOptions:方法;
4.针对冷启动不同阶段针对性优化
一、dyld阶段优化:
- 减少动态库、合并一些动态库(定期清理不必要的动态库)
- 减少Objc类、分类的数量、减少Selector数量(定期清理不必要的类、分类)
- 减少C++虚函数数量
- Swift尽量使用stuct
二、runtime阶段
- 用+initialize方法和dispatch_once取代所有的attribute((constructor))、C++静态构造器、Objc的+load
三、main函数阶段
- 在不影响用户体验的前提下,尽可能将一些操作延迟,不要全部都放在finishLaunching方法中。
- 按需加载(懒加载)
五、APP耗电优化
尽可能降低CPU、GPU功耗
少用定时器
-
优化I/0操作
- 尽量不要频繁写入小数据,最好批量一次性写入
- 读写大量重要数据时,考虑用dispatch_io,其提供了基于GCD的异步操作文件I/O的API,用dicpatch_io系统会优化磁盘访问
- 数据量比较大的,建议使用数据库(比如:SQlite,CoreData)
-
网络优化
- 减少、压缩网络数据 (XML体积比较大,JSON体积比较小)
- 如果多次请求的结果是相同的,尽量使用缓存。
- 使用断点续传,否则网络不稳定时可能多次传输相同的内容
- 网络不可用时,不要尝试执行网络请求
- 让用户不要取消长时间或者速度很慢的网络操作,设置合适的超时时间
-
批量传输
- 如下载视频流时,不要传输很小的包,直接下载整个文件或者一大块一大块的下载。
- 如下载广告时候,一次性多下载一些,然后在慢慢显示。
-
定位优化
- 如果只是需要快速确定用户位置,最好用CLLocationManager的requestLocation方法,这个方法定位完成后,会自动让定位硬件断电
- 如果不是导航应用,尽量不要实时更新位置,定位完毕就关掉定位服务。
- 尽量降低定位精度,比如尽量不要使用精度最高的kCLLocationAccuracyBest
- 需要后台定位时,尽量设置pauseLocationUpdatesAutomatically为YES,如果用户不太可能移动的时候系统会自动暂停位置更新。
六、安装包瘦身
安装包(ipa)主要由可执行文件、资源组成两部分组成:
- 瘦身资源(图片、视频、音频等)
- 采取无损压缩
- 去除没有用的资源
- 可执行文件瘦身
- 编译器优化:
- Strip Linked Product、Make Strings Read-Only、Symbols Hidden by Default 设置为YES
- 去掉异常支持,Enable C++ Exceptions、Enable Objective-C Exceptions设置为NO, Other cFlags添加-fno-exceptions
- 利用AppCode(https://www.jetbrains.com/objc)检测未使用的代码
- 编写LLVM插件检测出重复代码、未被调用代码
- 编译器优化: