小測驗

了解alloc和init的原理之前，我們先看看以下這幾行程式碼，以下分別輸出對象的內容，對象的地址，對象的指針的地址，打印結果如下

    LGPerson *p1 = [LGPerson alloc];
    LGPerson *p2 = [p1 init];
    LGPerson *p3 = [p1 init];
   
    LGNSLog(@"%@ - %p - %p",p1,p1,&p1);
    LGNSLog(@"%@ - %p - %p",p2,p2,&p2);
    LGNSLog(@"%@ - %p - %p",p3,p3,&p3);

<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2068
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2060
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2058

為什麼

前兩個%@→p1，%p→p1地址會一樣，而%p→&p1又跟大家不一樣呢?

原因

程式在運行時會先進行類加載，即在代碼段中開闢空間,內部存放聲明的屬性及方法。
在使用alloc時會在堆區開闢一個空間，內部有isa指針，這個指針指向所屬的類對象。
而棧區的指針保存的是對象的地址

對象在內存中的儲存.png

註：想知道類在代碼段的地址可以透過

   Class cls1 = object_getClass(p1);
                NSLog(@"%p" , cls1);

0x1022147c8

由上述的圖可以知道小測驗中，初步了解打印的區別

那麼到底alloc＆init的原理是什麼呢？

準備工作

請參考底層探索分析的三種方法

三種下斷點方式
)

下載源碼

Source Browser

編譯源碼，請參考大神

編譯源碼

alloc源碼探索

流程

源碼搭配斷點調適查看 alloc:

+ (id)alloc {
    return _objc_rootAlloc(self);
}

進入_objc_rootAlloc

id _objc_rootAlloc(Class cls) {
    return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}

進入callAlloc

到這邊會不確定進入哪個流程，不過我們可以透過源碼搭配斷點調適，判斷邏輯走到哪個流程，來到了_objc_rootAllocWithZone

static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false) {
#if __OBJC2__
    // checkNil 为false，!cls 也为false ，不会返回nil
    if (slowpath(checkNil && !cls)) return nil;
    // 是否有自定义的 +allocWithZone 实现
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif
    // No shortcuts available.
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

怎麼知道是走到_objc_rootAllocWithZone 的呢？

首先我們透過符號斷點添加_objc_rootAlloc ，callAlloc ，_objc_rootAllocWithZone

因為直接運行起來可能斷著不是我們想要的流程，所以先disable停用一下，接著運行起來

接下來想要看看alloc後面到底調用了什麼吧？
這時再啟用剛剛添加的符號斷點，確保我們斷著的斷點是我們想要看的流程

過掉斷點來到_objc_rootAlloc

再過掉斷點來到_objc_rootAllocWithZone

可以發現為什麼直接從_objc_rootAlloc 直接跳到了_objc_rootAllocWithZone
因為編譯器優化了，可以看到源碼如下。

編譯器優化－fastpath&slowpath
其中的__builtin_expect指令是由gcc引入的，
1、目的：編譯器可以對代碼進行優化，以減少指令跳轉帶來的性能下降。即性能優化
2、作用：允许程序员将最有可能执行的分支告诉编译器。
3、指令的寫法為：__builtin_expect(EXP, N)。表示EXP==N的概率很大。
4、fastpath定義中__builtin_expect((x),1)表示x 的值为真的可能性更大；即執行if裡面語句的機會更大
5、slowpath定義中的__builtin_expect((x),0)表示x 的值为假的可能性更大。即執行else裡面語句的機會更大
6、在日常的開發中，也可以通過設置來优化编译器，達到性能优化的目的，設置的路徑為：Build Setting--> Optimization Level--> Debug-->將None改為fastest或者smallest

//x很可能为1，程式走if括弧內的實現
#define fastpath(x) (__builtin_expect(bool(x), 1)) 
//x很可能为0，程式走else括弧內的實現
#define slowpath(x) (__builtin_expect(bool(x), 0))

static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源码 第三步
{
#if __OBJC2__ //有可用的编译器优化
    /*
     参考链接：(https://www.jianshu.com/p/2684613a300f)
     */
    
    // checkNil 为false，!cls 也为false ，所以slowpath 为 false，假值判断不会走到if里面，即不会返回nil
    //fastpath(x)表示x很可能不為0，希望編譯器進行優化；slowpath(x)表示x很可能為0，希望編譯器進行優化-這裡表示cls大概率是有值的，編譯器可以不用每次都讀取return nil指令
    if (slowpath(checkNil && !cls)) return nil;
    
    //判断一个类是否有自定义的 +allocWithZone 实现，没有则走到if里面的实现
    if (fastpath(!cls->ISA()->hasCustomAWZ())) {
        return _objc_rootAllocWithZone(cls, nil);
    }
#endif

    // No shortcuts available. // 没有可用的编译器优化
    if (allocWithZone) {
        return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
    }
    return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}

跳轉至_objc_rootAllocWithZone 的源碼實現

id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)// alloc 源码 第四步
{
    // allocWithZone under __OBJC2__ ignores the zone parameter
    //zone 參數不再使用 類創建實例內存空間
    return _class_createInstanceFromZone(cls, 0, nil,
                                         OBJECT_CONSTRUCT_CALL_BADALLOC);
}

跳轉至_class_createInstanceFromZone 的源碼實現，這部分是alloc源碼的核心操作，該方法的實現主要分為三個部分

cls→instanceSize:計算需要開闢的內存空間大小
calloc:申請內存，返回地址指針
obj→initInstanceIsa:將類與isa關聯

static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
                              int construct_flags = OBJECT_CONSTRUCT_NONE,
                              bool cxxConstruct = true,
                              size_t *outAllocatedSize = nil)// alloc 源码 第五步
{
    ASSERT(cls->isRealized()); //检查是否已经实现

    // Read class's info bits all at once for performance
    //一次性读取类的位信息以提高性能
    bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
    bool hasCxxDtor = cls->hasCxxDtor();
    bool fast = cls->canAllocNonpointer();
    size_t size;

    //计算需要开辟的内存大小，传入的extraBytes 为 0
    size = cls->instanceSize(extraBytes);
    if (outAllocatedSize) *outAllocatedSize = size;

    id obj;
    if (zone) {
        obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
    } else {
        //申请内存
        obj = (id)calloc(1, size);
    }
    if (slowpath(!obj)) {
        if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
            return _objc_callBadAllocHandler(cls);
        }
        return nil;
    }

    if (!zone && fast) {
        //将 cls类 与 obj指针（即isa） 关联
        obj->initInstanceIsa(cls, hasCxxDtor);
    } else {
        // Use raw pointer isa on the assumption that they might be
        // doing something weird with the zone or RR.
        obj->initIsa(cls);
    }

    if (fastpath(!hasCxxCtor)) {
        return obj;
    }
    construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
    return object_cxxConstructFromClass(obj, cls, construct_flags);
}

alloc核心操作

核心操作都位於calloc方法中

cls->instanceSize:計算所需內存大小

流程

跳轉至instanceSize 的源碼實現

size_t instanceSize(size_t extraBytes) const {
    //编译器快速计算内存大小
    if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
        return cache.fastInstanceSize(extraBytes);
    }

    // 计算类中所有属性的大小 + 额外的字节数0
    size_t size = alignedInstanceSize() + extraBytes;
    // CF requires all objects be at least 16 bytes.
    //如果size 小于 16，最小取16
    if (size < 16) size = 16;
    return size;
}

經過斷點調適，執行cache.hasFastInstanceSize方法，快速計算內存大小。

跳轉至fastInstanceSize 的源碼實現，通過斷點調適，來到align16

size_t fastInstanceSize(size_t extra) const
{
    ASSERT(hasFastInstanceSize(extra));

    //Gcc的内建函数 __builtin_constant_p 用于判断一个值是否为编译时常数，如果参数EXP 的值是常数，函数返回 1，否则返回 0
    if (__builtin_constant_p(extra) && extra == 0) {
        return _flags & FAST_CACHE_ALLOC_MASK16;
    } else {
        size_t size = _flags & FAST_CACHE_ALLOC_MASK;
        // remove the FAST_CACHE_ALLOC_DELTA16 that was added
        // by setFastInstanceSize
        //删除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8个字节
        return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
    }
}

跳轉到align16的源碼實現，以下是16字節對齊算法

//16字節對齊算法
static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

想知道什麼是16字節對齊算法，請先參考

內存對齊原理

看完了內存對齊原理，了解為什麼要內存對齊後，我們來看看這個16字節對齊算法，為什麼是這樣寫呢？又代表了什麼意思？

為什麼要16字節對齊

cpu存取數據時，以區塊來做範圍的讀取，如果讀取到的資料是沒有經過對齊的，資料讀取上就要花更多的次數讀取完成，意味著增加了cpu讀取時的負擔。
由於一個對象的本質為結構體，且第一個屬性為isa指針(佔８個字節)，在沒有其他屬性的狀況下，會預留８個字節，其目的是為了數據讀取的安全性，如果不預留，有可能造成資料讀取混亂。
蘋果早期以８字節對齊，現在以16字節對齊。

16字節對齊算法

在解決為什麼16字節是這樣寫之前，我們先來看看C++的位元運算子
在這裡出現了AND(&)和NOT(~)兩個位元運算子，AND就是兩者數據為１時輸出１，其餘為０，NOT就是將１變０，０變１。
有了以上知識後，我們來看看

//16字節對齊算法
static inline size_t align16(size_t x) {
    return (x + size_t(15)) & ~size_t(15);
}

calloc:申請內存，返回地址指針

通過instanceSize計算的內存大小，向內存中申請大小為size的內存，並賦值給obj，因此obj是指向內存地址的指針

obj = (id)calloc(1, size);

這裡我們可以通過斷點來印證上述的說法，在未執行calloc時，po obj為nil，執行後，再po obj，返回了一個16進制的地址
然而在平常的開發中，一般一個對象的打印的格式都是類似於這樣的<LGPerson: 0x01111111f>（是一個指針）。為什麼這裡不是呢？
主要是因為objc 地址還沒有與傳入的cls進行關聯
同時印證了alloc的根本作用就是開闢内存

obj->initInstanceIsa：類與isa關聯

經過calloc可知，內存已經申請好了，類也已經傳入進來了，接下來就需要將類與地址指針即isa指針進行關聯，其關聯的流程圖如下所示

類與isa關聯.png

initInstanceIsa流程

主要過程就是初始化一個isa指針，並將isa指針指向申請的內存地址，在將指針與cls類進行關聯
同樣也可以通過斷點調試來印證上面的說法，在執行完initInstanceIsa後，在通過po obj可以得出一個對象指針

總結

通過對alloc源碼的分析，可以得知alloc的主要目的就是開闢內存，而且開闢的內存需要使用16字節對齊算法，現在開闢的內存的大小基本上都是16的整數倍
開闢內存的核心步驟有3步：計算 -- 申請 -- 關聯

init源碼探索

alloc源碼探索完了，接下來探索init源碼，通過源碼可知，init的源碼實現有以下兩種

類方法init

+ (id)init {
    return (id)self;
}

這裡的init是一個構造方法，是通過工廠設計（工廠方法模式）,主要是用於給用戶提供構造方法入口。這裡能使用id強轉的原因，主要還是因為内存字节对齐後，可以使用類型強轉為你所需的類型

實例方法init

通過以下代碼進行探索實例方法init

LGPerson *objc = [[LGPerson alloc] init];

通過main中的init跳轉至init的源碼實現

- (id)init {
    return _objc_rootInit(self);
}

跳轉至_objc_rootInit的源碼實現

id
_objc_rootInit(id obj)
{
    // In practice, it will be hard to rely on this function.
    // Many classes do not properly chain -init calls.
    return obj;
}

有上述代碼可以，返回的是傳入的self本身。

new 源碼探索

一般在開發中，初始化除了init，還可以使用new，兩者本質上並沒有什麼區別，以下是objc中new的源碼實現，通過源碼可以得知，new函數中直接調用了callAlloc函數（即alloc中分析的函數），且調用了init函數，所以可以得出new 其实就等价于 [alloc init]的結論

+ (id)new {
    return [callAlloc(self, false/*checkNil*/) init];
}

但是一般開發中並不建議使用new，主要是因為有時會重寫init方法做一些自定義的操作，用new初始化可能會無法走到自定義的部分。

alloc&init原理