ncnn中内存对齐

在ncnn源码net.cpp中，int Net::load_param(const unsigned char* _mem)函数中你可以看到这么一段代码：

    if ((unsigned long)_mem & 0x3)
    {
        // reject unaligned memory
        fprintf(stderr, "memory not 32-bit aligned at %p\n", _mem);
        return -1;
    }

将指针地址和0x3进行位与，目的其实是判断指针地址是不是4字节对齐的，主要的原因是不对齐，cpu读取的效率会变低，具体举例就是本来只需要一次读取的可能需要两次读取了。

什么是内存对齐

cpu在读取内存时是一块一块进行读取的，块的大小可以是2，4，8，16（总之是2的倍数）。举例来说：如果一个变量int 的起始地址偏移是1，那么CPU要取这个地址上的数据，需要取两次。如图，cpu按四字节读取，第一次读取0x0 ~ 0x3，

image.png

cpu第二次读取0x4 ~ 0x7，这时cpu才能读到这个int的值。

image.png

如果内存对齐了呢，就如下只需一次读取：

image.png

typedef struct {
    int a;             //4字节
    double b;      //8字节
    short c;         //2字节
}A;

typedef struct {
    int a;             //4字节
    short b;         //2字节
    double c;      //8字节
}B;

上面两个结构体，理论上来说它们是一样大小的，但是当我们sizeof(A)=24，sizeof(B)=16。分析一下：对结构体A来说，a占4个字节，占从0 ~ 3的字节，b是double类型占8个字节，占从8 ~ 15的字节，c占两个字节，从16 ~ 17的字节。对结构体B来说，a占4个字节，从0 ~ 3，b占两个字节从4 ~ 6；c占8个字节从8 ~ 15。当然上面的分析是针对gcc编译器的，不同的编译器有不同的对齐规则。

内存对齐规则

1、对于结构的各个成员，第一个成员位于偏移为0的位置，以后每个数据成员的偏移量必须是min(#pragma pack()指定的数，这个数据成员的自身长度) 的倍数。
2、在数据成员完成各自对齐之后，结构(或联合)本身也要进行对齐，对齐将按照#pragma pack指定的数值和结构(或联合)最大数据成员长度中，比较小的那个进行。
3、必须是2的整数倍

内存对齐

ncnn中内存对齐

什么是内存对齐

内存对齐规则

友情链接更多精彩内容