ctestcode <代码实验室>栏目的每个代码实验,都提供了源代码,
可以用C语言编码助手导入,直接运行,进行实验,学习和验证。
代码实验室: “隐藏“的性能 Killer
【memset性能陷进】
memset是大家常用的函数,而且一般的编程书籍都会告诫大家:申请内存后要初始化,防止使用未经初始化的内存导致不可预知的结果,所以我们一般都会按照如下方式编写代码:
代码看起来很正常,但这里却隐藏着一个陷进:memset并未利用系统DMA特性,性能并不高!如果你的内存在1K左右,可能还察觉不到,但如果是1M,又是嵌入式系统,那性能影响就很明显了,我们来看实测数据 某ARM CPU gcc 4.1.2 上的表现
【“隐藏”的memset】
但这只是memset的第一个陷阱,还有更加隐蔽的第二个陷阱,而且这个陷阱你从代码上根本看不出和memset有什么关系!下面我们就来看这个“潜伏”的memset究竟是如何潜伏的。
代码很简单,就是在栈内存中申请缓冲区,然后再赋值:
这一行代码很简单,但就是这么一行简单的代码,却隐藏了一个陷阱:初始化的时候调用了memset。我们用<ltrace 程序名>工具来看看:
可能会有同学会说 gcc编译时加上 O2或者O3 优化参数,就不会隐含调用memset了. 想法很好,但实际运用中当把 buffer 传入函数指针的函数时。GCC就无法进行判断做出正确的优化。
大家可以下载源代码,进行实验。
3个case中,最后一个case没有对变量初始化,不占用CPU资源。
总结:对于大内存数据的初始化,建议先分析数据的使用,如果确定必要,再对数据进行初始化操作。