二、OOM问题的可能原因
重点关注下面两点
✔️ 堆内存分配失败时的OOM == /art/runtime/gc/heap.cc
✔️ 创建线程失败时的OOM == /art/runtime/thread.cc
三、OOM -- 堆内存分配失败
在source code中我们可以看到,当堆内存分配失败时,会抛出一些典型的log,如下代码
在出现OOM问题时,logcat中应该会看到类似下面的信息输出
08-1911:34:53.8602802828028EAndroidRuntime:java.lang.OutOfMemoryError:Failedtoallocatea20971536byteallocationwith6147912free bytes and6003KB until OOM,target footprint134217728,growth limit134217728
上面这段logcat的大概解释:想要去分配 20971536 bytes的heap memory,但时app剩余可用的free heap只有6147912 bytes,而且当前app最大可分配的heap是134217728 bytes
堆内存分配失败的原因可以分两种情况:
1. 超过APP进程的heap内存上限 与 2. 没有足够大小的连续地址空间
3.1 超过APP进程的内存上限
Android设备上java虚拟机对单个应用的最大内存分配做了约束,超出这个值就会OOM。由Runtime.getRuntime.MaxMemory()可以得到Android中每个进程被系统分配的内存上限,当进程占用内存达到这个上限时就会发生OOM,这也是Android中最常见的OOM类型。
3.2 没有足够大小的连续地址空间
这种情况一般是进程中存在大量的内存碎片导致的,其堆栈信息会比第一种OOM堆栈多出一段类似如下格式的信息
:failed duetofragmentation(required continguous free “<<required_bytes<<“ bytesforanewbuffer where largest contiguous free ”<<largest_continuous_free_pages<<“ bytes)”
相关的代码在art/runtime/gc/allocator/rosalloc.cc中,如下
voidRosAlloc::LogFragmentationAllocFailure(std::ostream&os,size_t failed_alloc_bytes){...if(required_bytes>largest_continuous_free_pages){os<<"; failed due to fragmentation ("<<"required contiguous free "<<required_bytes<<" bytes"<<new_buffer_msg<<", largest contiguous free "<<largest_continuous_free_pages<<" bytes"<<", total free pages "<<total_free<<" bytes"<<", space footprint "<<footprint_<<" bytes"<<", space max capacity "<<max_capacity_<<" bytes"<<")"<<std::endl;}}
这种场景比较难模拟,这里就不做演示了。
四、OOM -- 创建线程失败
Android中线程(Thread)的创建及内存分配过程分析可以参见如下这篇文章:https://blog.csdn.net/u011578734/article/details/109331764
线程创建会消耗大量的系统资源(例如内存),创建过程涉及java层和native的处理。实质工作是在native层完成的,相关代码位于 /art/runtime/thread.cc
4.1 创建JNI Env 失败
一般有两种原因
1. FD溢出导致JNIEnv创建失败了,一般logcat中可以看到信息 Too many open files ... Could not allocate JNI Env
当进程fd数(可以通过 ls /proc/pid/fd | wc -l 获得)突破 /proc/pid/limits中规定的Max open files时,产生OOM
E/art:ashmem_create_region failedfor'indirect ref table':Toomanyopenfilesjava.lang.OutOfMemoryError:Couldnot allocate JNIEnvatjava.lang.Thread.nativeCreate(NativeMethod)atjava.lang.Thread.start(Thread.java:730)
2. 虚拟内存不足导致JNIEnv创建失败了,一般logcat中可以看到信息 Could not allocate JNI Env: Failed anonymous mmap
4.2 创建线程失败
一般有两种原因
1. 虚拟内存不足导致失败,一般logcat中可以看到信息 mapped space: Out of memory ... pthread_create (1040KB stack) failed: Out of memory
native层通过FixStackSize设置线程栈大小,默认情况下,线程栈所需内存总大小 = 1M + 8k + 8k,即为1040k。
4.3 debug技巧
对于FD的限制
可以执行 cat /proc/pid/limits来查看Max open files 最大打开的文件数量
可以执行 ls /proc/pid/fd | wc -l来查看进程打开的文件数量
对于线程数量的限制
可以执行cat /proc/sys/kernel/threads-max 查看系统最多可以创建多少线程
可以执行echo 3000 > /proc/sys/kernel/threads-max修改这个值,做测试
查看系统当前的线程数 top -H
对于虚拟内存使用情况
可以执行 cat /proc/pid/status | grep Vm查看VmSize及VmPeak