前言
在研究内存字节对齐之前,先通过两个简单的案例了解一下内存大小占用情况:
新建一个工程,创建一个对象:ZLObject
-
案例一
打印 malloc
结果如下:
-
案例二
添加如下属性和方法:
打印 malloc
结果如下:
结论:
一个对象的实际内存大小和实例大小可能会
不一样
。例如图中的情况,实际内存大小是32字节,而实例大小是24字节。
栈内存
是8字节
对齐
为什么实际内存大小和实例大小 不一样
呢?原因是:底层在分配内存的时候,做了 内存对齐
,下面就深入了解 内存对齐
的原则。
什么是内存对齐原则?
还是先通过一个案例,分析内存如何分配的。
- 创建几个属性,分别对属性赋值,并打印其内存情况。
- 打印
obj
的内存
分配情况,并分别打印其地址指向
的内容:
通过打印可知,obj
内存有三块 0x600000d283c0
、0x600000d283d0
、0x600000d283e0
每块都有两个地址,且每块内存都是16字节
,通过地址打印结果分析:
- 第一块的第一个地址指向
ZLObject
,说明是isa指针;第二个地址没有打印到结果。 - 第二块的第一个地址指向
张三
,对应的是name
属性;第二个地址指向zhang
,对应的是nickName
属性。 - 第三块的第一个地址指向
北京市
,对应的是address
属性;第二个地址指向空,说明没有内容。
为什么唯独 0x0000001600006261
这个地址没有打印出东西呢?仔细观察发现,其中 0x00000016
就是数字 22
,对应的是 age
属性;0x00006261
就是 ASCII
的 a
,b
,对应的就是 a
,b
属性。
总结:堆空间内存是
16字节
对齐
内存对齐原则
- 数据成员对⻬规则:结构体(
struct
)或联合体(union
)的数据成员,第⼀个
数据成员放在offset
为0
的地⽅,以后每个数据成员存储的起始位置
要从该成员⼤⼩或者成员的⼦成员⼤⼩(只要该成员有⼦成员,⽐如说是数组,结构体等)的整数倍开始。不够整数倍的补齐。(⽐如int
为4
字节,则要从4
的整数
倍地址开始存储。 - 结构体作为成员:如果⼀个结构体⾥有某些结构体成员,则结构体成员要从其
内部最⼤元素
⼤⼩的整数倍
地址开始存储。(比如struct a
⾥存有struct b
,b
⾥有char
,int
,double
等元素,那b
应该从8
的整数倍开始存储。) - 收尾⼯作:结构体的总⼤⼩,也就是
sizeof
的结果,必须是其内部最⼤成员
的整数倍
,不⾜的要补⻬。
下表是各种数据类型占用内存大小,根据对应类型来计算结构体中内存大小。
通过实际的案例来理解内存对齐原则
案例一
创建两个结构体,分析其内存分配情况:
根据内存对齐原则,分析以上两个结构体的内存分配情况,最后再打印出结果。
结果与分析的一致。
案例二
创建嵌套结构体,分析其内存分配情况:
根据内存对齐原则,分析以上两个嵌套结构体的内存分配情况,最后再打印出结果。
结果与分析的一致。
为什么要进行内存对齐
内存对齐是编译器的管辖范围,编译器在编译时会为程序中的每个数据单元安排在适当的位置上,这个过程就叫内存对齐
。
很多 CPU(如基于 Alpha,IA-64,MIPS,和 SuperH 体系的)拒绝读取 未对齐
数据。当一个程序要求这些 CPU 读取 未对齐
数据时,这时 CPU 会进入 异常处理状态
并且通知程序 不能继续
执行。所以,如果编译器不进行内存对齐,那在很多平台的上的开发将难以进行。
那么,为什么这些 CPU 会拒绝读取 未对齐
数据?是因为 未对齐
的数据,会大大降低 CPU 的性能。
CPU 存取原理
程序员通常认为内存印象,由一个个的字节组成。
但是,你的 CPU 并 不是
以 字节
为单位存取数据的。CPU 把内存当成是 一块一块
的,块的大小可以是 2
,4
,8
,16
字节大小,因此 CPU 在读取内存时也是一块一块进行读取的。每次内存存取都会产生一个固定的 开销
,减少内存存取次数将提升程序的 性能
。所以 CPU 一般会以 2
/4
/8
/16
/32
字节为单位来进行存取操作。我们将上述这些存取单位也就是块大小称为(memory access granularity)内存存取粒度。
为了说明内存对齐背后的原理,我们通过一个例子来说明从未对齐地址
与 对齐地址
读取数据的差异。
案例
在一个存取粒度为 8 字节的内存中,先从地址 0 读取 8 个字节到寄存器,然后从地址 3 读取 8 个字节到寄存器。
- 当从地址 0 开始读取数据时,读取
对齐地址
的数据,直接通过一次
读取就能完成。 - 当从地址 3 开始读取数据时,读取
非对齐地址
的数据,需要读取两次
数据才能完成。
读取 非对齐地址
的数据后,还要将 0-7 的数据向上偏移 3 字节,将 8-F 的数据向下偏移 5 字节。最后再将两块数据合并放入寄存器。
对一个 内存未对齐
的数据进行了这么多额外的操作,这对 CPU 的开销很大,大大降低了CPU性能。所以才会进行内存对齐。
总结
-
栈内存
是8字节
对齐 -
堆内存
是16字节
对齐