一、结构体定义
结构体中的数据成员可以是基本类型,也可以是数组,也可以是指针,还可以是其他的结构体。下面是一个结构体的定义示例:
struct Student {
bool sex;
short int age;
char *address;
float grade;
char name[9];
};
二、结构体尺寸
一个被经常讨论的问题就是求结构体的尺寸(Size
)大小,也就是结构体实例占用的内存字节数。结构体的尺寸受操作系统字长、编译器、对齐方式等众多因素的影响。因此要确认一个结构体的尺寸时如果没有上述的约束前提则是没有统一结果的。一般情况下计算结构体尺寸大小有如下规则:
字节对齐规则
- 结构体中每个数据成员的偏移位置是数据成员本身尺寸的倍数。
- 结构体的尺寸是最大基础类型数据成员尺寸的倍数。
- 如果有结构体嵌套时,被嵌套的结构体成员的偏移位置就是被嵌套结构体中尺寸最大的基础类型数据成员尺寸的倍数。嵌套结构体的尺寸则是所有被嵌套中的以及自身中的最大基础类型数据成员尺寸的倍数。
字节对齐好处
- 内存是以字节为基本单位,
cpu
在存取数据时,是以块为单位存取,并不是以字节为单位存取。频繁存取未对齐的数据,会极大降低cpu
的性能。字节对齐后,会减低cpu
的存取次数,这种以空间换时间的做法目的降低cpu
的开销。 -
16
字节对齐,是由于在一个对象中,第一个属性isa
占8
字节(继承自父类),当然一个对象肯定还有其他属性,当无属性时,会预留8
字节,即16
字节对齐,如果不预留,相当于这个对象的isa
和其他对象的isa
紧挨着,容易造成访问混乱;
按照上述的规则,就可以得出上面示例结构体在64位系统下的尺寸了:
在上面的布局图中可以看出:
- sex数据成员是bool型,它占用
1
个字节的内存,而且是结构体中的第一个数据成员,第一个数据成员的偏移位置总是从0开始(0是任何数据类型尺寸的倍数)。 - age数据成员是short int,它占用
2
个字节的内存,它的偏移位置是2(2是2的倍数)。同时我们看到在第一个数据成员和第二个数据成员之间留下了一个字节的空隙,我们称之为padding。 - address数据成员是void *, 它占用
8
个字节的内存,它的偏移位置是8(8是8的倍数)。这个数据成员为了对齐留出了4
个字节的padding空隙。 - grade数据成员是float, 它占用
4
个字节的内存,它的偏移量是16(16是4的倍数)。这个成员没有留下padding。 - name数据成员是char[9],它占用
9
个字节,它的偏移位置是20(20是1的倍数)。它也没有留下padding。 - 整个结构体中最大数据成员的尺寸是void*,它占用
8
个字节的内存,因此结构体的尺寸是8的倍数也就是32
个字节。同时看到在尾部留下了3
个字节的padding。
从上面的例子可以看出因为需要对齐,结构体中的数据成员并不一定是连续保存的,而是有可能会存在一些padding空隙。 这也引出了另外一个问题就是:当我们在定义结构体时如果数据成员的定义顺序安排的不合理就有可能会导致多余内存空间的占用和浪费。 为了达到最佳内存空间占用,可以将上述结构体中数据成员的定义顺序进行调整如下:
struct Student {
bool sex;
char name[9];
short int age;
float grade;
char *address;
};
就可以得出优化后的内存布局:
怎样才能获得最优的排列顺序呢?我的建议是按基础数据类型的尺寸从小到大(或从大到小)的顺序进行排列。
最后再来看看结构体有嵌套的情况下尺寸的计算规则,以下面的结构体定义为例:
struct A {
int a1;
char a2;
};
struct B {
char b1;
struct A b2;
};
结构体A的尺寸在64位系统下占用 8
个字节,那么结构体B的尺寸以及b2的偏移又是多少呢?
根据前面的嵌套规则定义可以得出: 所有结构体中最大的基础数据类型是A中的int a1 ,它占用了 4
个字节。因此得出B的尺寸是 12
,而b2的偏移则是int长度(4
)的倍数。
三、OC类的数据成员和尺寸
1. OC类的属性
无论是结构体还是类其实都是一些数据的集合的声明和描述,OC类也是如此。只不过在OC类中除了声明数据成员外,还可以定义方法。当然方法本身是不会占用对象的存储空间的。
在OC类中声明的实体属性最终会转化为数据成员。每个OC类中还会有一个隐式的数据成员isa,这是一个指针类型的数据成员,并且是作为类的第一个数据成员被定义。 因此下面的OC类定义:
@interface Student
@property short int age;
@property NSString *address;
@property float grade;
@property BOOL sex;
@end
如果转化为结构体的话就会变成:
struct Student {
void *isa;
BOOL _sex;
short int _age;
float _grade;
NSString *_address;
};
从上面的定义中可以看出,除了会多出一个isa数据成员外,数据成员的顺序也发生了变化,它不再是按OC中定义的属性顺序进行排列了。编译器会自动优化OC类中属性的排列顺序, 也就是说:
OC类中定义的属性顺序会在编译时进行优化调整,其调整的规则就是先按数据类型的尺寸从小到大进行排列,相同尺寸的数据成员则按字母顺序进行排列。
因此我们在定义OC类时不需要考虑属性的定义顺序,系统会优化这些顺序以便达到最小的内存占用。
最后再来说说OC类实例对象的内存占用问题。OC类的对象内存尺寸占用按如下规则进行计算:
- 64位系统中是所有数据成员的总和并且是8的倍数,32位系统中是所有数据成员的总和并且是4的倍数。
- 最小为
16
个字节。
2. OC类的内部数据成员
OC类中定义的实例属性系统在编译时会默认转化为一个带下划线的数据成员,属性数据成员的内存排列顺序会被优化处理。在实际中我们还可以在OC类中直接定义内部的数据成员,比如下面的形式:
@interface Student
@property NSString *address;
@property BOOL sex;
@end
@implementation Student {
//内部的数据成员
BOOL a[7];
NSString *b;
}
@end
上面的实现中定义了两个内部数据成员a,b。当出现这种情况时编译器不会对这些内部数据成员的顺序进行优化,而是按定义的顺序在内存中进行排列,并且是优先于属性数据成员进行排列。因此上面的例子最终的内存布局结构为:
struct Student {
void *isa;
BOOL a[7];
NSString *b;
BOOL _sex;
NSString *_address;
};
因此个人不建议在OC类中定义内部数据成员,因为它会影响最终的对象内存占用情况。如果实在是要定义的话就需要考虑这些内部数据成员的定义顺序以便达到最佳的内存占用布局来减少对象内存实例的占用。就以上面的代码为例,在64位系统下的最佳定义顺序应该如下:
@interface Student
@property NSString *address;
@property BOOL sex;
@end
@implementation Student {
//内部的数据成员
NSString *b;
BOOL a[7];
}
@end