Ceva xm4 DSP开发心得

最近做了CevaDsp相关的开发,其实和Neon开发有点类似,主要是代码向量化运算。
Dsp芯片内含2个向量运算器,可以并行计算8个数值。

先说一下具体环境,使用的是,Windows10 + CevaToolbox v16
Ceva的这个编译器,license每年2500美刀,永久版是10000美刀,Ceva的仿真器,3000美刀。
还是挺贵的。

0、需要熟悉CevaDsp指令集,不然啥也干不了。

1、Ceva并行L/S指令,vpld,vpst,一次可以加载8个数据,
远比Neon,SSE强大,可以跨距超大加载,还支持自定义索引
8个数据的索引可以是(2,3,5,7,9,10,11,13)
但是bank不能冲突,64字节为冲突,索引也不能相同。

2、Ceva float强转int,short自带四舍五入,和C/C++原本语义不同。

3、Ceva float指令有 1 cycle 开根号,求导数的指令vfpinv,vfpsqrt,vfpsqrti
但是这些指令都是16位定点数,有一定的误差

4、片内内存速度是片外DDR的十几倍,没有cache,
全靠自己DMA操作进去,算完了DMA操作出来。

5、Ceva 有 1cycle 做卷积的指令,简直6上天。

6、条件判断影响并行,可以先做一个循环把有效数据提取出来,再做一个循环真正处理数据。

7、经常看不出来代码如何并行,要潜下心来多思考。


就酱。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 转载自:http://www.cnblogs.com/xylc/p/5410517.html 方便笔记和后续学习,...
    请叫我未雨先森阅读 3,926评论 0 1
  • 开篇一张图,后面听我编 1. 知识准备 1.1 中央处理器(CPU) 中央处理器(CPU,Central Proc...
    He_Yu阅读 47,236评论 7 115
  • 1. 基础知识 1.1、 基本概念、 功能 冯诺伊曼体系结构1、计算机处理的数据和指令一律用二进制数表示2、顺序执...
    yunpiao阅读 5,398评论 1 22
  • 唤醒49-16 触动 倔强的母亲总是触动我心里最柔软的地方 今天在电梯里遇见了住在我家楼下的...
    我和榕树阅读 253评论 5 1
  • 主动让利,未尝不是一个好方法 1、所有的交换都源于对对方的信任 ,此时此刻只适合此时此刻做,评估关系的深入程度,给...
    陈先生小可爱阅读 366评论 0 0