卡顿优化

1、卡顿问题分析指标

  • CPU 的使用率
    我们可以把 CPU 时间分为两种:用户时间和系统时间。用户时间和系统时间。用户时间就是执行用户态应用程序代码所消耗的时间;系统时间就是执行内核态系统调用所消耗的时间,包括 I/O、锁、中断以及其他系统调用所消耗的时间,包括 I/O、锁、中断以及其他系统调用的时间。

  • CPU饱和度
    CPU 饱和度反映的是线程排队等待 CPU 的情况,也就是CPU 的负载情况。CPU 饱和度首先会跟应用的线程数有关,如果启动的线程过多,容易导致系统不断地切换执行的线程,把大量的时间浪费在上下文切换都需要刷新寄存器和计数器,至少需要几十纳秒的时间。

2、Android 卡顿排查工具

分析工具主要分为两流派,第一个流派是 instrument。获取一段时间内所有函数的调用过程,可以通过分析这段时间内的函数调用流程,再进一步分析待优化的点;第二个流派是 sample。有选择性或者采用抽样的方式观察某些函数调用过程,可以通过这些有限的信息推测出流程中的可疑点,然后再继续细化分析。

1)Traceview

Traceview 属于 instrument 类型,它利用 Android Runtime 函数调用的 event事件,将函数运行的耗时和调用关系写入 trace 文件中。它可以用来查看整个过程有哪些函数调用,但是工具本身带来的性能开开销过大,有时无法反映真实的情况。

2)Nanoscope

Uber开源instrument类型性能分析工具,其实现原理直接修改Android 虚拟机源码,在ArtMethod执行入口和执行结束位置增加埋点代码,将所有的的信息先写到内存,等到trace结束后统计生成结果文件。
缺点:

  • 需要自己刷ROM,并且当前只支持Nexus 6P,或者采用其提供的x86架构的模拟器。
  • 默认只支持主线程采集,其他线程需要代码手动设置,考虑到内存大小的限制,每个线程的内存数组只能支持大约20秒的时间段。

3)systrace

systrace是Android 4.1新增的性能分析工具,其利用了Linux的ftrace调试工具,相当于在系统各个关键位置都增加了一些性能指针,即在代码中增加了埋点。Android在ftrace的基础上封装了atrace,增加了更多特有的指针,例如,Graphics,ActivityManager、Dalvik VM、System Server等。
systrace 工具只能监控特定系统调用的耗时情况,所以它是属于 sample 类型,而且性能开销非常低。但是它不支持应用程序代码的耗时分析,所以在使用时有一些局限性。
我们可以通过编译时给每个函数插桩的方式来实现,也就是在重要函数插桩的方式来实现,也就是在重要函数的入口和出口分别增加Trace.beginSection和Trace.endSection。当然出于性能的考虑,我们会过滤大部分指令数比较少的函数,这样就实现了在 systrace 基础上增加应用程序耗时的监控。通过这样方式的好处有:

  • 可以看到整个流程系统和应用程序的调用流程。包括系统关键线程的函数调用,例如渲染耗时、线程锁,GC 耗时等。
  • 性能损耗可以接受。由于过滤了大部分的短函数,而且没有放大I/O,所以整个运行耗时不到原来的两倍,基本可以反映真实情况。

4)Simpleperf

Android 5.0 新增了Simpleperf性能分析工具,它利用 CPU 的性能监控单元(PMU)提供的硬件 perf 事件。使用 Simpleperf 可以看到所有的 Native 代码的耗时,有时候一些 Android 系统库的调用对分析问题有比较大的帮助,例如加载 dex、verify class 的耗时等。
Simpleperf同时封装了systrace的监控功能,它属于sample类型,性能开销非常低,使用火焰图展示分析结果。

3、可视化分析工具

Android studio的Profiler集成了如下几种分析工具:

  • Sample Java Methods 的功能,类似于Traceview的sample类型;
  • Trace Java Methods的功能,类似于Traceview的instrument类型;
  • Trace System Calls 的功能,类似于systrace;
  • SampleNative (API Level 26+)的功能类似于Simpleperf。

1)Call Chart

Call Chart是Traceview和systrace默认使用的展示方式,它按照应用程序的函数执行顺序来展示,适合分析整个流程的调用。


image.png

2)Flame Chart

Flame Chart即是大名鼎鼎的火焰图,它以一个全局的视野来看待一段时间的调用分布,可以很自然的把空间和时间维度上的信息融合在一张图上,如下图所述的例子:


image.png

4、卡顿监控方法

1)消息队列

通过替换Looper的Printer实现监控消息消费情况,通过一个监控线程,每个1秒向主线程的头部插入1个空的消息,假设1秒后这个消息还没有被消费掉,说明小子阻塞的时间是0~1秒,查询消息还没被消费的次数,即可粗略估算卡顿时间,缺点是无法精确确认空消息的发送间隔,且带来不小的性能损耗

2)插装

在方法的出入口或核心出采用插装的方式埋入统计的代码,详细的监控我们所关心的数据,但要考虑性能的损耗和代码的稳定性,一定要考虑下面的问题:

  • 避免方法数暴增
  • 过滤简单的函数
  • 白名单设计
    插桩方案看起来美好,它也有自己的短板,那就是只能监控应用内自身的函数耗时,无法监控系统的函数调用,整个堆栈看起来好像“缺失了”一部分。

3)Profilo

Facebook开源库Profilo综合了各大方案的优点,总结来说如下:

  • 集成atrace功能,ftrace所有性能埋点数据都会通过trace_marker文件写入到内核缓冲区,Profilo通过PLT Hook拦截了写入操作,截取了部分数据用于分析,这样所有systrace的探针都可以拿到,诸如,四大组件的生命周期、锁等待时间、类校验、GC时间等;
  • 快速获取Java堆栈,Profilo的实现类似Native崩溃捕捉的方式快速获取Java堆栈,不用插装,性能损失小。捕捉信息齐全。当然它也有不足问题,内部使用了许多Hook,兼容性是个大问题,且不支持Android 8.0和9.0。

4)帧率

我们通常使用帧率来衡量界面的流程度,Android Vitals 将连续丢帧超过700毫秒定义为冻帧,也就是连续丢帧42帧以上。冻帧率就是计算发生冻帧时间在所有时间的占比,出现丢帧的时候,我们可以获取当前的页面信息,View信息和操作路径信息,降低二次排查的暗度。

5)生命周期监控

Activity、Service、Fragment、Receiver等组件的生命周期的耗时和调用次数也是我们关注的重点。对于组件生命周期我们应该采用更加严格地监控。

6)线程监控

Java线程的使用情况可以帮助我们发现问题,主要会监控一下两点:

  • 线程数量
  • 线程时间,监控线程的用户时间 utime、系统时间 stime 和优先级
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,406评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,732评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,711评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,380评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,432评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,301评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,145评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,008评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,443评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,649评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,795评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,501评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,119评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,731评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,865评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,899评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,724评论 2 354

推荐阅读更多精彩内容

  • 最近在极客时间学习,做一下总结。 Android卡顿排查工具 常用的排查工具分为两种类型: instrument类...
    affyzh阅读 1,527评论 0 1
  • 概要 应用运行时的卡顿问题非常影响用户体验,严重降低产品表现力,本文将介绍应用卡顿原因以及分析方法等等。 卡顿问题...
    某昆阅读 2,553评论 1 8
  • 造成卡顿的原因有很多 最终会反映到CPU时间上CPU时间分为两种:1⃣️用户时间执行用户态应用程序代码消耗的时间2...
    34sir阅读 2,584评论 0 4
  • 1. 工具选择 CPU Profiler、Systrace、StrictMode 原因复杂:代码、内存、绘制、IO...
    perry_Fan阅读 2,232评论 2 15
  • 一幅静物素描,画画停停,今天都三天了,终于画完了。
    黄河故道边的一个教书匠阅读 81评论 0 1