ANR处理

Application Not Responding,也就是应用程序无响应

Android系统中,ActivityManagerService(简称AMS)WindowManagerService(简称WMS)会检测App的响应时间,如果App在特定时间无法相应屏幕触摸或键盘输入时间,或者特定事件没有处理完毕,就会出现ANR。

以下四个条件都可以造成ANR发生:

  • InputDispatching Timeout:5秒内无法响应屏幕触摸事件或键盘输入事件

  • BroadcastQueue Timeout :在执行前台广播(BroadcastReceiver)的onReceive()函数时10秒没有处理完成,后台为60秒。

  • Service Timeout :前台服务20秒内,后台服务在200秒内没有执行完毕。

  • ContentProvider Timeout :ContentProvider的publish在10s内没进行完。

为什么会超时呢?

超时时间的计数一般是从按键分发给app开始。超时的原因一般有两种

(1)当前的事件没有机会得到处理(即UI线程正在处理前一个事件,没有及时的完成或者looper被某种原因阻塞住了)

(2)当前的事件正在处理,但没有及时完成

如何避免KeyDispatchTimeout

1UI线程尽量只做跟UI相关的工作

2:耗时的工作(比如数据库操作,I/O,连接网络或者别的有可能阻碍UI线程的操作)把它放入单独的线程处理

3:尽量用Handler来处理UIthread和别的thread之间的交互

那么哪些属于UI线程呢?

UI线程主要包括如下:

  1. Activity:onCreate(), onResume(), onDestroy(), onKeyDown(), onClick(),etc

  2. AsyncTask: onPreExecute(), onProgressUpdate(), onPostExecute(), onCancel,etc

  3. Mainthread handler: handleMessage(), post*(runnable r), etc

  4. other

怎么分析

看WindowManager、ActivityManager相关的log

可以看到cpu使用率和iowait情况

示例:

04-01 13:12:11.572** I/InputDispatcher( 220): Application is not responding**:Window{2b263310com.android.email/com.android.email.activity.SplitScreenActivitypaused=false}. 5009.8ms since event, 5009.5ms since waitstarted

04-0113:12:11.572 I/WindowManager( 220): Input event dispatching timedout sending tocom.android.email/com.android.email.activity.SplitScreenActivity

04-01 13:12:14.123 I/Process( 220): Sending signal. PID: 21404 SIG: 3---发生ANR的时间和生成trace.txt的时间

04-01 13:12:14.123 I/dalvikvm(21404):threadid=4: reacting to signal 3

……

04-0113:12:15.872 E/ActivityManager( 220): ANR in com.android.email(com.android.email/.activity.SplitScreenActivity)

04-0113:12:15.872 E/ActivityManager( 220): Reason:keyDispatchingTimedOut

04-0113:12:15.872 E/ActivityManager( 220): Load: 8.68 / 8.37 / 8.53

04-0113:12:15.872 E/ActivityManager( 220): CPUusage from 4361ms to 699ms ago ----CPU在ANR发生前的使用情况

04-0113:12:15.872 E/ActivityManager( 220): 5.5%21404/com.android.email: 1.3% user + 4.1% kernel / faults: 10 minor

04-0113:12:15.872 E/ActivityManager( 220): 4.3%220/system_server: 2.7% user + 1.5% kernel / faults: 11 minor 2 major

04-0113:12:15.872 E/ActivityManager( 220): 0.9%52/spi_qsd.0: 0% user + 0.9% kernel

04-0113:12:15.872 E/ActivityManager( 220): 0.5%65/irq/170-cyttsp-: 0% user + 0.5% kernel

04-0113:12:15.872 E/ActivityManager( 220): 0.5%296/com.android.systemui: 0.5% user + 0% kernel

04-0113:12:15.872 E/ActivityManager( 220): 100%TOTAL: 4.8% user + 7.6% kernel + 87% iowait

04-0113:12:15.872 E/ActivityManager( 220): CPUusage from 3697ms to 4223ms later:-- ANR后CPU的使用量

04-0113:12:15.872 E/ActivityManager( 220): 25%21404/com.android.email: 25% user + 0% kernel / faults: 191 minor

04-0113:12:15.872 E/ActivityManager( 220): 16% 21603/__eas(par.hakan: 16% user + 0% kernel

04-0113:12:15.872 E/ActivityManager( 220): 7.2% 21406/GC: 7.2% user + 0% kernel

04-0113:12:15.872 E/ActivityManager( 220): 1.8% 21409/Compiler: 1.8% user + 0% kernel

04-0113:12:15.872 E/ActivityManager( 220): 5.5%220/system_server: 0% user + 5.5% kernel / faults: 1 minor

04-0113:12:15.872 E/ActivityManager( 220): 5.5% 263/InputDispatcher: 0% user + 5.5% kernel

04-0113:12:15.872 E/ActivityManager( 220): 32%TOTAL: 28% user + 3.7% kernel

从LOG可以看出ANR的类型,CPU的使用情况,如果CPU使用量接近100%,说明当前设备很忙,有可能是CPU饥饿导致了ANR

系统中活跃进程的CPU占用率,关键的一句:100%TOTAL: 4.8% user + 7.6% kernel + 87% iowait;表示CPU占用满负荷了,其中绝大数是被iowait即I/O操作占用了。我们就可以大致得出是io操作导致的ANR。

如果CPU使用量很少,说明主线程被BLOCK了

如果IOwait很高,说明ANR有可能是主线程在进行I/O操作造成的

trace.txt文件

  1. $chmod 777 /data/anr

  2. $rm /data/anr/traces.txt

  3. $ps

  4. $kill -3 PID

  5. adbpull data/anr/traces.txt ./mytraces.txt

从trace.txt件查看调用stack.

android studio 提供了 Analyze -> Analyze Stacktrace 工具分析,将trace.txt 复制到窗口,单击normalize ,生成 tread dump,左边为线程列表,右边为线程中的具体信息。 如果某个线程被标红,就说明线程被堵塞。

看代码

仔细查看ANR的成因(iowait?block?memoryleak?)

死锁案例:

刚拿到anr的trace,还是无头绪,都是调用栈的dump,仔细看看,发现一个很好的信息隐藏在这个栈帧信息中:

如下一个栈帧:

----- pid 861 at 2012-02-11 14:57:50 -----

Cmd line: system_server

DALVIK THREADS:

(mutexes: tll=0 tsl=0 tscl=0 ghl=0)

"main" prio=5 tid=1 MONITOR

| group="main" sCount=1 dsCount=0 obj=0x2ba9c460 self=0x8e820

| sysTid=861 nice=0 sched=0/0 cgrp=[fopen-error:2] handle=716342112

| schedstat=( 0 0 0 ) utm=464 stm=65 core=0

at com.android.server.am.ActivityManagerService.isUserAMonkey(ActivityManagerService.java:~6546)

  • waiting to lock <0x2c1141c8> (a com.android.server.am.ActivityManagerService) held by tid=59 (Binder Thread #6)

at android.app.ActivityManagerNative.onTransact(ActivityManagerNative.java:1273)

at com.android.server.am.ActivityManagerService.onTransact(ActivityManagerService.java:1545)

at android.os.Binder.execTransact(Binder.java:338)

at com.android.server.SystemServer.init1(Native Method)

at com.android.server.SystemServer.main(SystemServer.java:808)

at java.lang.reflect.Method.invokeNative(Native Method)

at java.lang.reflect.Method.invoke(Method.java:511)

at com.android.internal.os.ZygoteInit$MethodAndArgsCaller.run(ZygoteInit.java:784)

at com.android.internal.os.ZygoteInit.main(ZygoteInit.java:551)

at dalvik.system.NativeStart.main(Native Method)

这说明什么?看上面的红色部分,说明这个主线程在等待锁一个object 0x2c1141c8 (通常就是synchronized操作,这里就是com.android.server.am.ActivityManagerService类型的一个object),但被tid=59占住了, 再看看 tid=59的栈帧:

"Binder Thread #6" prio=5 tid=59 MONITOR

| group="main" sCount=1 dsCount=0 obj=0x2c3bd838 self=0x34c5d8

| sysTid=1120 nice=0 sched=0/0 cgrp=[fopen-error:2] handle=3460688

| schedstat=( 0 0 0 ) utm=168 stm=48 core=0

at com.android.server.am.BatteryStatsService.noteStopWakelock(BatteryStatsService.java:~114)

  • waiting to lock <0x2c117d50> (a com.android.internal.os.BatteryStatsImpl) held by tid=13 (ProcessStats)

at com.android.server.PowerManagerService.noteStopWakeLocked(PowerManagerService.java:798)

at com.android.server.PowerManagerService.releaseWakeLockLocked(PowerManagerService.java:1015)

at com.android.server.PowerManagerService.releaseWakeLock(PowerManagerService.java:967)

at android.os.PowerManager$WakeLock.release(PowerManager.java:319)

at android.os.PowerManager$WakeLock.release(PowerManager.java:300)

at com.android.server.am.ActivityStack.activityIdleInternal(ActivityStack.java:3254)

at com.android.server.am.ActivityManagerService.activityIdle(ActivityManagerService.java:3953)

at android.app.ActivityManagerNative.onTransact(ActivityManagerNative.java:362)

at com.android.server.am.ActivityManagerService.onTransact(ActivityManagerService.java:1545)

at android.os.Binder.execTransact(Binder.java:338)

at dalvik.system.NativeStart.run(Native Method)

tid为何没有释放锁object 0x2c1141c8呢?因为它在等到锁 object 0x2c117d50(一个com.android.internal.os.BatteryStatsImpl类型的对象)!如果有较丰富的捉虫经验的话, 想必都清楚了,持锁时又请求锁,极大的可能就是死锁了!

refer:

https://blog.csdn.net/WHB20081815/article/details/70245594 (逻辑清晰)
https://blog.csdn.net/u014630142/article/details/81709459(案例多)

https://blog.csdn.net/qq_30993595/article/details/80277333(源码角度)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容