以上为对象alloc时的基本过程,经测试[NSObject alloc]时并没有经过_objc_rootAlloc而是走objc_alloc方法,然后执行callAlloc,下面做个对比。
其他NSObject子类alloc时:
_objc_rootAlloc(Class cls)
{
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
[NSObject alloc]时:
objc_alloc(Class cls)
{
return callAlloc(cls, true/*checkNil*/, false/*allocWithZone*/);
}
callAlloc
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
//slowpath(x):x很可能为假,为真的概率很小
//fastpath(x):x很可能为真
//slowpath fastpath编译器优化用
if (slowpath(checkNil && !cls)) return nil;
//判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
_class_createInstanceFromZone方法是我们这次的重点研究对象。
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
fastpath 跟slowpath为编译器优化操作。
重要的三步:
1)size = cls->instanceSize(extraBytes)
首先我们需要知道创建该对象需要多少内存空间,该方法内部会经过字节对齐,内存对齐操作来返回所需的内存空间。
8字节对齐
# define WORD_MASK 7UL
static inline uint32_t word_align(uint32_t x) {
return (x + WORD_MASK) & ~WORD_MASK;
}
16字节对齐
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
以上为其内部字节对齐的算法,以16字节对齐为例:加15表示向上取整,15取反后2进制末四位是0000,与以后其结果为16的倍数。
为什么要字节对齐?
其目的是为了空间换时间,cpu读取内存次数越多越消耗性能,频繁读取字节未对齐的数据相对更加消耗性能。
为什么是16字节?
对象所占最小内存为8字节,因为isa占8字节,还需要留有其他成员变量的空间,取16字节比较安全。
补充:对象所占内存空间的大小只与成员变量有关,成员变量所占内存空间足够小的情况下,编译器会优化内存空间,将几个成员变量的内存地址放在一起。
inline size_t instanceSize(size_t extraBytes) const {
//如果有缓存16字节对齐
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
//如果没有缓存8字节对齐但是最小为16字节
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
if (size < 16) size = 16;
return size;
}
如果有缓存16字节对齐,如果没有缓存8字节对齐但是最小16字节。
2)obj = (id)calloc(1, size)
用上一步得到的size来开辟内存空间并给obj指针赋值(obj跟类实例关联绑定)。
3)obj->initInstanceIsa(cls, hasCxxDtor)
初始化类实例的isa指针指向类对象(isa指针与类关联绑定),最后返回obj。调试时po obj可以看到第二步只能看见obj的地址值,第三步走完后obj前面添加显示了类名。
自此alloc流程走完。
初始化isa内容随后补充。
附加底层函数某些参数说明
nonpointer: 表示是否对指针开启指针优化、0:纯isa指针,1:不止是类对象地址,isa中包含了类信息,对象的引用计数等。
has_assoc: 关联对象标志位,0没有,1存在
has_cxx_dtor: 该对象是否有C++或者Objc的析构器,如果有析构函数,则需要做析构逻辑,如果没有,则可以更快的释放对象。
shiftcls: 存储类指针的值。开启指针优化的情况下,在arm64架构中有33位用来存储类指针。
magic: 用于调试器判断当前对象是真的对象还是没有初始化的空间。
weakly_referenced:标志对象是否被指向或者曾经指向一个ARC的弱变量,没有弱引用的对象可以更快释放。
deallocating: 标志对象是否正在释放对象。
has_sidetable_rc:当对象引用计数大于10时,则需要借用该变量存储进位
extra_rc: 当表示该对象的引用计数值,实际上是引用计数减1。如果对象的引用计数为10,那么extra_rc为9。如果引用计数大于10,则需要使用has_sidetable_rc。