手把手教你使用Systrace(一)

Systrace是分析Android性能问题的神器,Google IO 2017上更是对其各种强推;由于TraceView过于严重的运行时开销,我怀疑这个方向是不是压根儿就是错误的。个人预计Google会放弃TraceView转向全力支持Systrace;不过这个工具并不像TraceView那样简单直观,使用起来也不太方便,而且没有一个详尽的文档介绍如何使用和分析;本文和后续旨在弥补这一块的缺失,尽可能地完整介绍Systrace的方方面面。

在介绍使用之前,先简单说明一下Systrace的原理:它的思想很朴素,在系统的一些关键链路(比如System Service,虚拟机,Binder驱动)插入一些信息(我这里称之为Label),通过Label的开始和结束来确定某个核心过程的执行时间,然后把这些Label信息收集起来得到系统关键路径的运行时间信息,进而得到整个系统的运行性能信息。Android Framework里面一些重要的模块都插入了Label信息(Java层的通过android.os.Trace类完成,native层通过ATrace宏完成),用户App中可以添加自定义的Label,这样就组成了一个完成的性能分析系统。

TraceView试图收集某个阶段所有函数的运行信息(sampling的也是基于此思路),它希望在你并不知道哪个函数有问题的时候直接定位到关键函数;但可惜的是,****收集所有信息**** 这个是不现实的,它的运行时开销严重干扰了运行环境;一个人犯罪了,你要把全国人民都抓起来审问一遍吗?Systrace的思路是反过来的,在不清楚问题的情况下,你压根儿无法下手,只有掌握了一些基本的信息,通过假设-分析-验证 的过程一步一步找出问题的原因;TraceView那种一招吃遍天下鲜的方式,讲道理是不符合科学依据的(当然在特定的场合TraceView有他的用途)。

简单使用

Systrace对系统版本有一个要求,就是需要Android 4.1以上,最好是Android 4.3以上(我相信这个已经不是什么问题了);但是系统版本越高,Android Framework中添加的系统可用Label就越多,能够支持和分析的系统模块也就越多;因此,在可能的情况下,尽可能使用高版本的Android系统来进行分析;然后对待分析的App也有一个限制——需要是debuggable的。

与TraceView不同的是,systrace需要PC端配合手机端使用;然后systrace也没有办法在代码里面自由滴控制trace的开始和结束,因此刚开始使用有点别扭。

回到正题。首先,在手机端准备好你需要分析的过程的环境;比如假设你要分析App的冷启动过程,那就先把App进程杀掉,切换到Launcher中有你的App 图标的那个页面,随时准备点击图标启动进程;假设你要分析某个Activity的卡顿情况,那就先在手机上进入到上一个Activity,随时准备点按钮切换到待分析的Activity中。

有同学会问,至于这么如临大敌紧张兮兮的么?其实准备这个过程非常重要,因为Systrace没办法自由滴控制开始和结束(下面有一个办法可以缓解),而trace得到的数据有可能非常多,因此我们需要手工缩小需要分析的数据集合;不然你可能被一堆眼花缭乱的数据和图像弄得晕头转向,然后什么有用的结论也分析不出来。记住哦,****手动缩小范围,会帮助你加速收敛问题的分析过程,进而快速地定位和解决问题。****

手机上App上的环境准备好以后,打开PC端的命令行;进入systrace的目录,也即(假设$ANDROID_HOME是你Android SDK的根目录):

cd $ANDROID_HOME/platform-tools/systrace

然后执行如下命令:

./systrace.py -t 10 sched gfx view wm am app webview -a <package-name>

这样,systrace.py 这个脚本就通过adb给手机发送了收集trace的通知;与此同时,切换到手机上进行你需要分析的操作,比如点击Launcher中App的Icon启动App,或者进入某个Activity开始滑动ListView/RecyclerView。经过你指定的时间之后(以上是10s),就会有trace数据生成在当前目录,默认是 trace.html;用Chrome浏览器打开即可。

systrace.py命令的一般用法是:

systrace.py [options] [category1 [category2 ...]]

其中,[options] 是一些命令参数,[category] 等是你感兴趣的系统模块,比如view代表view系统(包含绘制流程),am代表ActivityManager(包含Activity创建过程等);分析不同问题的时候,可以选择不同你感兴趣的模块。需要重复的是,尽可能缩小需要Trace的模块,其一是数据量小易与分析;其二,虽然systrace本身开销很小,但是缩小需要Trace的模块也能减少运行时开销。比如你分析卡顿的时候,power, webview 就几乎是无用的。

[option] 中比较重要的几个参数如下:

  • -a <package_name>:这个选项可以开启指定包名App中自定义Trace Label的Trace功能。也就是说,如果你在代码中使用了Trace.beginSection("tag"), Trace.endSection;默认情况下,你的这些代码是不会生效的,因此,这个选项一定要开启!

  • -t N:用来指定Trace运行的时间,取决于你需要分析过程的时间;还是那句话,在需要的时候尽可能缩小时间;当然,绝对不要把时间设的太短导致你操作没完Trace就跑完了,这样会出现Did not finish 的标签,分析数据就基本无效了。

  • -l:这个用来列出你分析的那个手机系统支持的Trace模块;也就是上面命令中 [category1]能使用的部分;不同版本的系统能支持的模块是不同的,一般来说,高版本的支持的模块更多。

  • -o FILE:指定trace数据文件的输出路径,如果不指定就是当前目录的trace.html

systrace.py -l 可以输出手机能支持的Trace模块,而且输出还给出了此模块的用途;常用的模块如下:

  • sched: CPU调度的信息,非常重要;你能看到CPU在每个时间段在运行什么线程;线程调度情况,比如锁信息。

  • gfx:Graphic系统的相关信息,包括SerfaceFlinger,VSYNC消息,Texture,RenderThread等;分析卡顿非常依赖这个。

  • view: View绘制系统的相关信息,比如onMeasure,onLayout等;对分析卡顿比较有帮助。

  • am:ActivityManager调用的相关信息;用来分析Activity的启动过程比较有效。

  • dalvik: 虚拟机相关信息,比如GC停顿等。

  • binder_driver: Binder驱动的相关信息,如果你怀疑是Binder IPC的问题,不妨打开这个。

  • core_services: SystemServer中系统核心Service的相关信息,分析特定问题用。

这样,我们就学会了Systrace的使用;命令本身并不复杂,不过与TraceView相比,易用性差远了——但这是值得的,使用上的不便换来了极低运行时开销,而这对分析性能问题尤为重要。

先别急,如何分析数据是后话,我们先介绍一些使用上的小技巧。

无法代码控制开始和结束怎么办?

如上文所述,systrace没有办法在代码中控制Trace运行的开始和结束;那么,如果我们要分析App的启动性能,我点了桌面图标,把Trace时间设置为10s,我怎么知道这10s中,哪段时间是我App的启动过程?如果不知道我们需要分析的时间段,那后续不是扯淡么?

我们可以用自定义Trace Label解决;Android SDK中提供了android.os.Trace#beginSectionandroid.os.Trace#endSection 这两个接口;我们可以在代码中插入这些代码来分析某个特定的过程;比如我们觉得Fragment的onCreateView过程有问题,那就在onCreateView 中加上代码:

public View onCreateView(LayoutInflater inflater, @Nullable ViewGroup container,
            Bundle savedInstanceState) {
    Trace.beginSection("Fragement_onCreateView");
    // .. 其他代码
    // ...
    // .. 结束处
    Trace.endSection();
}

这样,在Trace的分析结果中就会带上Fragement_onCreateView 这个过程的运行时间段信息(当然你得开启 -a 选项!),如下:

image

我们可以在任意自己感兴趣的地方添加自定义的Label;一般来说,分析过程就是,你怀疑哪里有问题,就在那那个函数加上Label,运行一遍抓一个Trace,看看自己的猜测对不对;如果猜测正确,进一步加Label缩小范围,定位到具体的自定义函数,函数最终调用到系统内部,那就开启系统相关模块的Trace,继续定位;如果猜测错误,那就转移目标,一步步缩小范围,直至问题收敛。

回到正题,我们如何控制Systace的开始和结束?事实上这是没法办到的,不过控制开始和结束的目的是什么?其实就是得到开始和结束这段时间内的Trace信息。要达到这个目的,我们只需要在期望开始和结束的地方加上自定义的Label就可以了。比如你要分析App的冷启动过程,那就在Application类的attachBaseContext调用Trace.beginSection("Boot Procedure"),然后在App首页的onWindowFocusChanged 或者你认为别的合适的启动结束点调用Trace.endSection就可以到启动过程的信息;比如下图是我的Label:

image

从bindApplication到activityStart,到Phase2,Phase3;这几个过程组合就是我感兴趣的启动过程。从图中可以直观地看出来,从Application到activityStart占用了启动一半的时间,activityStart下面那有一大段空白是在干什么?这是个问题。

如何分析非Debug的App

systrace官方文档说待trace的App必须是debuggable的,但是官方又说,debuggable的App与非debuggable的性能有较大差别;因为系统为了支持debug开启了一些列功能并且关闭掉了某些重要的优化,见 文档

Run a release (or at least non-debuggable) version of your app. The ART runtime disables several important optimizations in order to support debugging features, so make sure you're looking at something similar to what a user will see.

如果我们想要待分析的App尽可能接近真实情况,那么必须要在非Debug的App中能启用systrace功能;因为相同情况下Debug的App性能比非Debuggable的差,你无法确保在debuggable版本上分析出来的结论能准确推广到非debuggable的版本上。

分析systrace源码之后 ,发现这个条件只是个障眼法而已;我们可以手动开启App的自定义Label的Trace功能,方法也很简单,调用一个函数即可;但是这个函数是SDK @hide的,我们需要反射调用:

Class<?> trace = Class.forName("android.os.Trace");
Method setAppTracingAllowed = trace.getDeclaredMethod("setAppTracingAllowed", boolean.class);
setAppTracingAllowed.invoke(null, true);

把这段代码放在Application的attachBaseContext 中,这样就可以手动开启App自定义Label的Trace功能,在非debuggable的版本中也适用!

OK,systrace命令的使用说到这里也没什么要注意的了;其实命令的使用不难,分析思路也很简单:合理假设-> 加自定义Label验证 -> (结论成立-> 缩小范围继续)/(结论推翻-> 重新假设) 这样一步一步直至问题收敛;如果你分析了一段时间,发现问题是发散的,一会儿觉得是这里有问题,一会儿又觉得是那里有问题,那么或许你的假设根本就是错误的;需要重新调整方向分析。

转于:https://zhuanlan.zhihu.com/p/27331842

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,053评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,527评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,779评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,685评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,699评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,609评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,989评论 3 396
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,654评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,890评论 1 298
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,634评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,716评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,394评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,976评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,950评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,191评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,849评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,458评论 2 342

推荐阅读更多精彩内容