240 发简信
IP属地:江苏
  • 120
    Convolution的变形 -- Convolution、 InnerProduct、MatMul、BLAS(GEMM、GEMV) 之间的关联

    1 前言 MNN 模型模型转换结束后进行 optimizeNet 的第一项即为 turnInnerProduct2Convolution,抛开各种复杂的优化考虑,单是 减少了...

  • 120
    矩阵相乘在GPU上的终极优化:深度解析Maxas汇编器工作原理

    在从事深度学习框架的实现工作时,了解到Nervana有一个称为Maxas的汇编代码生成器项目https://github.com/NervanaSystems/maxas,可...

  • 120
    2018-10-25【机器视觉笔录】OpenCV中的API及用法

    -------------------------------- Author : ShawnDong updateDate :2018.11.25 Blog : Shaw...

  • 120
    Nvidia Jetson TX2 JetPack 3.3 刷机

    前言 最近入手了Jetson TX2开发者套件,已经成功刷了JetPack 3.3版本,打算把刷机过程分享出来供更多人参考. 硬件组装注意事项 先上一张图 硬件组装过程中要注...

  • 120
    什么?!NEON还要优化?

    官网介绍: NEON宏观介绍 NEON Programmer’s Guide Version: 1.0 直观认识 NEON整体描述Arm NEON technology is...

  • 时间统计方法

    1 C语言的时间统计 1.1 linux系统 1.2 windows系统 2 C++语言的时间统计 C++11中新增的时间库chrono主要包含了三个概念: duration...