OC底层-alloc探索

1622886434916.jpg

以上为对象alloc时的基本过程,经测试[NSObject alloc]时并没有经过_objc_rootAlloc而是走objc_alloc方法,然后执行callAlloc,下面做个对比。

其他NSObject子类alloc时:

_objc_rootAlloc(Class cls)
{
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

[NSObject alloc]时:

objc_alloc(Class cls)
{
    return callAlloc(cls, true/*checkNil*/, false/*allocWithZone*/);
}

callAlloc

callAlloc(Class cls, bool checkNil, bool allocWithZone=false)
{
#if __OBJC2__
    //slowpath(x):x很可能为假,为真的概率很小
    //fastpath(x):x很可能为真
    //slowpath fastpath编译器优化用
    if (slowpath(checkNil && !cls)) return nil;
    //判断该类是否实现自自定义的 +allocWithZone,没有则进入if条件句
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

_class_createInstanceFromZone方法是我们这次的重点研究对象。

_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                              int construct_flags = OBJECT_CONSTRUCT_NONE,
                              bool cxxConstruct = true,
                              size_t *outAllocatedSize = nil)
{
    ASSERT(cls->isRealized());

    // Read class's info bits all at once for performance
    bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();
    size_t size;

    size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (zone) {
        obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
    } else {
        obj = (id)calloc(1, size);
    }
    if (slowpath(!obj)) {
        if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
            return _objc_callBadAllocHandler(cls);
        }
        return nil;
    }

    if (!zone && fast) {
        obj->initInstanceIsa(cls, hasCxxDtor);
    } else {
        // Use raw pointer isa on the assumption that they might be
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (fastpath(!hasCxxCtor)) {
        return obj;
    }

    construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
    return object_cxxConstructFromClass(obj, cls, construct_flags);
}

fastpath 跟slowpath为编译器优化操作。
重要的三步:
1)size = cls->instanceSize(extraBytes)
首先我们需要知道创建该对象需要多少内存空间,该方法内部会经过字节对齐,内存对齐操作来返回所需的内存空间。

8字节对齐

#   define WORD_MASK 7UL
static inline uint32_t word_align(uint32_t x) {
    return (x + WORD_MASK) & ~WORD_MASK;
}

16字节对齐

static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

以上为其内部字节对齐的算法,以16字节对齐为例:加15表示向上取整,15取反后2进制末四位是0000,与以后其结果为16的倍数。

为什么要字节对齐?
其目的是为了空间换时间,cpu读取内存次数越多越消耗性能,频繁读取字节未对齐的数据相对更加消耗性能。

为什么是16字节?
对象所占最小内存为8字节,因为isa占8字节,还需要留有其他成员变量的空间,取16字节比较安全。

补充:对象所占内存空间的大小只与成员变量有关,成员变量所占内存空间足够小的情况下,编译器会优化内存空间,将几个成员变量的内存地址放在一起。

inline size_t instanceSize(size_t extraBytes) const {
        //如果有缓存16字节对齐
        if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
            return cache.fastInstanceSize(extraBytes);
        }
        //如果没有缓存8字节对齐但是最小为16字节
        size_t size = alignedInstanceSize() + extraBytes;
        // CF requires all objects be at least 16 bytes.
        if (size < 16) size = 16;
        return size;
    }

如果有缓存16字节对齐,如果没有缓存8字节对齐但是最小16字节。

2)obj = (id)calloc(1, size)
用上一步得到的size来开辟内存空间并给obj指针赋值(obj跟类实例关联绑定)。

3)obj->initInstanceIsa(cls, hasCxxDtor)
初始化类实例的isa指针指向类对象(isa指针与类关联绑定),最后返回obj。调试时po obj可以看到第二步只能看见obj的地址值,第三步走完后obj前面添加显示了类名。

自此alloc流程走完。
初始化isa内容随后补充。

附加底层函数某些参数说明

nonpointer:     表示是否对指针开启指针优化、0:纯isa指针,1:不止是类对象地址,isa中包含了类信息,对象的引用计数等。
has_assoc:      关联对象标志位,0没有,1存在
has_cxx_dtor:   该对象是否有C++或者Objc的析构器,如果有析构函数,则需要做析构逻辑,如果没有,则可以更快的释放对象。
shiftcls:       存储类指针的值。开启指针优化的情况下,在arm64架构中有33位用来存储类指针。
magic:          用于调试器判断当前对象是真的对象还是没有初始化的空间。
weakly_referenced:标志对象是否被指向或者曾经指向一个ARC的弱变量,没有弱引用的对象可以更快释放。
deallocating:   标志对象是否正在释放对象。
has_sidetable_rc:当对象引用计数大于10时,则需要借用该变量存储进位
extra_rc:       当表示该对象的引用计数值,实际上是引用计数减1。如果对象的引用计数为10,那么extra_rc为9。如果引用计数大于10,则需要使用has_sidetable_rc。
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容