在搜题 App,我们遇到了一个比较奇怪的闪退问题。具体表现为:在一些较老的设备(例如 iPhone 8)上,加载 TensorFlow 模型时会抛出 bad_alloc
异常。通过分析日志,我们发现此时设备剩余的可用内存大约只有 30MB,而 TensorFlow 模型加载时需要大约 55MB 的内存,导致了闪退。
虽然像 iPhone 8 这样的设备内存有 2GB,正常情况下不太可能出现内存不足的情况,但仍然出现了闪退。因此,问题可能源于内存泄漏。通过复测 TensorFlow 模型相关功能,我们初步定位到,问题出现在使用相机拍照后,内存会持续增长,退出相关页面后内存并没有完全恢复。
为了解决这个问题,我们使用了三种工具来定位内存泄漏。
Allocations
-
打开方式
点击 Xcode 的 Product -> Profile,运行 App 后打开Instruments选择 Allocations。
-
分析内存占用
启动后,Allocations 面板显示了程序运行中对象申请内存分配的情况,能够统计当前内存中分配了哪些对象、对象的数量以及由哪些函数创建了这些对象。
统计到的内存包括 All Heap Allocations 和 All Anonymous VM。其中,All Heap Allocations 是堆内存,All Anonymous VM 是虚拟内存,由系统分配,我们无法直接控制。因此,我们需要关注的主要是 All Heap Allocations。
从图中可以看到,内存在标记为 1 和 2 的位置有明显的增长,并且在退出相关页面后,内存没有恢复到原先的状态。我们选中标记 1,点击 Call Trees 查看调用栈。
该视图主要用于分析哪些对象在创建时占用了大量内存,它通过调用栈来记录对象创建时的内存使用情况。不过,我们更关心的是当前内存中有哪些对象占用了大量内存,Allocations工具在这方面的表现不太符合我们的需求。
Leaks
-
打开方式
点击 Xcode 的 Product -> Profile,运行 App 后打开Instruments选择 Leaks。
-
定位内存泄漏
启动 Leaks 后,它会在程序运行时记录内存分配信息,并检查是否发生了内存泄漏。当发生内存泄漏时,会用红色叉号标记,并显示泄漏对象的调用栈。点击红色叉号后,我们可以查看内存泄漏的具体位置和调用栈,直接跳转到相应的代码位置。
Memory Graph Debugger
-
打开方式
运行app后,点击这里,选择View Memory Graph Hierarchy
or
-
查看内存占用
左侧面板显示了当前时刻内存中的对象,每个类名称旁边都会显示其实例数(例如:
LaunchViewController
)。下方的感叹号会标记可能发生内存泄漏的对象,但由于统计不完全,仍需要我们进一步寻找。
在右侧面板,我们可以查看到
LaunchViewController
的实例引用关系图,其中,深色线表示强引用,浅色线表示不明确的引用(可能是强引用,也可能是弱引用)。
点击类节点左上角的“•••”可以查看该类的所有实例对象,右上角的“•••”则展示该对象的所有实例变量。
-
定位内存泄漏
定位内存泄漏的方法如下:首先,使用 Memory Graph Debugger 分析初始状态的内存分布并保存截图。然后,进行相关的流程操作(如使用相机拍照、进入页面等),完成操作并返回初始状态后,再次打开内存分布并截屏。重复几次后,通过对比截图,找出那些实例数持续增加的类,从而确定内存泄漏的来源。
例如,在这次搜题 App 的问题中,每次使用相机拍照并返回初始页面时,观察截图可以发现 CoreGraphics 的实例数在增加。进一步展开查看后,发现是 CGImage 实例的数量增加。通过全局检索CGImageCreate等相关关键字,并分析代码,我们最终定位到问题的根源:在拍照后对照片进行自动裁剪时,临时创建的 CGImage 对象没有被释放。修复这一问题后,发布新版本,成功降低了crash率。