内存对齐

ncnn中内存对齐

在ncnn源码net.cpp中,int Net::load_param(const unsigned char* _mem)函数中你可以看到这么一段代码:

    if ((unsigned long)_mem & 0x3)
    {
        // reject unaligned memory
        fprintf(stderr, "memory not 32-bit aligned at %p\n", _mem);
        return -1;
    }

将指针地址和0x3进行位与,目的其实是判断指针地址是不是4字节对齐的,主要的原因是不对齐,cpu读取的效率会变低,具体举例就是本来只需要一次读取的可能需要两次读取了。

什么是内存对齐

cpu在读取内存时是一块一块进行读取的,块的大小可以是2,4,8,16(总之是2的倍数)。举例来说:如果一个变量int 的起始地址偏移是1,那么CPU要取这个地址上的数据,需要取两次。如图,cpu按四字节读取,第一次读取0x0 ~ 0x3,


image.png

cpu第二次读取0x4 ~ 0x7,这时cpu才能读到这个int的值。


image.png

如果内存对齐了呢,就如下只需一次读取:
image.png
typedef struct {
    int a;             //4字节
    double b;      //8字节
    short c;         //2字节
}A;

typedef struct {
    int a;             //4字节
    short b;         //2字节
    double c;      //8字节
}B;

上面两个结构体,理论上来说它们是一样大小的,但是当我们sizeof(A)=24,sizeof(B)=16。分析一下:对结构体A来说,a占4个字节,占从0 ~ 3的字节,b是double类型占8个字节,占从8 ~ 15的字节,c占两个字节,从16 ~ 17的字节。 对结构体B来说,a占4个字节,从0 ~ 3,b占两个字节从4 ~ 6;c占8个字节从8 ~ 15。当然上面的分析是针对gcc编译器的,不同的编译器有不同的对齐规则。

内存对齐规则

1、 对于结构的各个成员,第一个成员位于偏移为0的位置,以后每个数据成员的偏移量必须是min(#pragma pack()指定的数,这个数据成员的自身长度) 的倍数。
2、 在数据成员完成各自对齐之后,结构(或联合)本身也要进行对齐,对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中,比较小的那个进行。
3、 必须是2的整数倍

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容