<小米开源框架MACE> 源码阅读笔记 2

上一篇 分析了 mace\public\mace.hmace\core\mace.cc 两个文件,本篇说一下与runtime相关的一些函数。首先是 mace\public\mace_runtime.h,其对应的源文件为 mace\core\mace_runtime.cc

mace\public\mace_runtime.h 中定义了 GPUCPU 运行时的一些API。这里定义的只是较为顶层的接口,具体实现在mace\core\runtime 文件夹下。这个文件夹下有 cpuhexagonopencl 三个子文件夹,分别对应 CPUDSPGPU 三种不同平台运行时 API 的相关实现。

由于本人不涉及 DSP 开发,此处只以 CPUGPU 为例。

cpu_runtime.h 和 cpu_runtime.cc

mace\core\runtime\cpu 下有 cpu_runtime.hcpu_runtime.cc两个文件, cpu_runtime.h中定义了GetCPUBigLittleCoreIDsSetOpenMPThreadsAndAffinityCPUsSetOpenMPThreadsAndAffinityPolicy三个函数。

GetCPUBigLittleCoreIDs函数是根据cpu大小核的频率来获取cpu不同核的ID(用到了操作系统的一些接口),mace\public\mace_runtime.h 中的GetBigLittleCoreIDs即是通过调用这个函数实现。

SetOpenMPThreadsAndAffinityCPUs函数使用OpenMP多线程机制进行CPU affinity的调度以提高程序的运行效率,如果没有开启OpenMP支持的话,则同样通过CPU affinity的调度实现线程的cpu绑定,减小切换损耗(同样用到了操作系统的一些API)。mace\public\mace_runtime.h 中的SetOpenMPThreadAffinity即是通过调用这个函数实现。

SetOpenMPThreadsAndAffinityPolicy函数根据Affinity Policymace\public\mace_runtime.h 中有定义)设置OpenMP并行化,需要开启OpenMPmace\public\mace_runtime.h 中的SetOpenMPThreadPolicy即是通过调用这个函数实现。

总的来说,mace\core\runtime\cpu\cpu_runtime.cc 针对OpenMP进行了相应的线程加速,同时通过CPU Affinity调度进行了相应的功耗优化。

OpenCL runtime

首先,从 mace\core\runtime\opencl\opencl_runtime.h 头文件中可以看出 MACE 支持的GPU包括 ADRENOMALIPowerVR,支持的 OpenCL 版本包括 1.0、1.1、1.2 和 2.0。

头文件中定义了OpenCLProfilingTimerOpenCLRuntime 两个类。

OpenCLProfilingTimer 继承自系统的 Timer 类,实现了一些与计时相关的功能。

OpenCLRuntime这个类用于实现 OpenCL程序 kernel 端代码的完整流程,包括获取 platform信息、获取device信息(GPU type)、创建context、创建CommandQueue、编译program、构建Kernel等。其中编译program 时,可以有几种不同的方式,如从源码、从Cache中、从预编译的二进制文件中。除此之外,代码中还涉及了GPU performance 管理的一些API(与CPU类型),同样是为了优化 GPU 的功耗(mace\public\mace_runtime.h 中的SetGPUHints函数即是通过OpenCLRuntime类的Configure函数实现)。

OpenCL中与Image相关的存储管理在mace\core\runtime\opencl\opencl_allocator.hmace\core\runtime\opencl\opencl_allocator.cc中实现(CPU中的相关代码在mace\core\allocator.cc中),通过OpenCLAllocator类来管理。

OpenCL runtime 涉及的代码较多,此处不一一展开。

由于 OpenCL 还不太熟,论述中可能会有差错,敬请拍砖(轻拍o( ̄ ̄)d )。

版权所有,欢迎转载,转载请注明出处

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 在前不久的某高峰论坛上,小米开源了其移动端的深度学习框架Mobile AI Compute Engine(MACE...
    Kaami阅读 8,650评论 2 2
  • 1、通过CocoaPods安装项目名称项目信息 AFNetworking网络请求组件 FMDB本地数据库组件 SD...
    阳明AI阅读 16,038评论 3 119
  • mean to add the formatted="false" attribute?.[ 46% 47325/...
    ProZoom阅读 7,593评论 0 3
  • Swift1> Swift和OC的区别1.1> Swift没有地址/指针的概念1.2> 泛型1.3> 类型严谨 对...
    cosWriter阅读 13,796评论 1 32
  • 相同的处境,不同的心态,迥异的结局。就像面对带刺的玫瑰,有人想到的是可怕的刺,有人想到的是美丽的花;看一件事...
    暖阳821阅读 2,823评论 0 0