小測驗
- 了解alloc和init的原理之前,我們先看看以下這幾行程式碼,以下分別輸出對象的內容,對象的地址,對象的指針的地址,打印結果如下
LGPerson *p1 = [LGPerson alloc];
LGPerson *p2 = [p1 init];
LGPerson *p3 = [p1 init];
LGNSLog(@"%@ - %p - %p",p1,p1,&p1);
LGNSLog(@"%@ - %p - %p",p2,p2,&p2);
LGNSLog(@"%@ - %p - %p",p3,p3,&p3);
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2068
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2060
<LGPerson: 0x60000307dcc0> - 0x60000307dcc0 - 0x7ffee6ff2058
為什麼
- 前兩個
%@→p1
,%p→p1
地址會一樣,而%p→&p1
又跟大家不一樣呢?
原因
- 程式在運行時會先進行類加載,即在代碼段中開闢空間,內部存放聲明的屬性及方法。
- 在使用alloc時會在堆區開闢一個空間,內部有isa指針,這個指針指向所屬的類對象。
- 而棧區的指針保存的是對象的地址
對象在內存中的儲存.png
註:想知道類在代碼段的地址可以透過
Class cls1 = object_getClass(p1);
NSLog(@"%p" , cls1);
0x1022147c8
- 由上述的圖可以知道小測驗中,初步了解打印的區別
那麼到底alloc&init的原理是什麼呢?
準備工作
- 請參考底層探索分析的三種方法
三種下斷點方式
)
- 下載源碼
- 編譯源碼,請參考大神
alloc源碼探索
流程
源碼搭配斷點調適查看
alloc:
+ (id)alloc {
return _objc_rootAlloc(self);
}
進入
_objc_rootAlloc
id _objc_rootAlloc(Class cls) {
return callAlloc(cls, false/*checkNil*/, true/*allocWithZone*/);
}
進入
callAlloc
- 到這邊會不確定進入哪個流程,不過我們可以透過源碼搭配斷點調適,判斷邏輯走到哪個流程,來到了
_objc_rootAllocWithZone
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false) {
#if __OBJC2__
// checkNil 为false,!cls 也为false ,不会返回nil
if (slowpath(checkNil && !cls)) return nil;
// 是否有自定义的 +allocWithZone 实现
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available.
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
怎麼知道是走到_objc_rootAllocWithZone
的呢?
- 首先我們透過符號斷點添加
_objc_rootAlloc
,callAlloc
,_objc_rootAllocWithZone
- 因為直接運行起來可能斷著不是我們想要的流程,所以先disable停用一下,接著運行起來
- 接下來想要看看alloc後面到底調用了什麼吧?
- 這時再啟用剛剛添加的符號斷點,確保我們斷著的斷點是我們想要看的流程
- 過掉斷點來到
_objc_rootAlloc
- 再過掉斷點來到
_objc_rootAllocWithZone
- 可以發現為什麼直接從
_objc_rootAlloc
直接跳到了_objc_rootAllocWithZone
- 因為編譯器優化了,可以看到源碼如下。
- 編譯器優化-fastpath&slowpath
其中的__builtin_expect
指令是由gcc
引入的,
1、目的:編譯器可以對代碼進行優化,以減少指令跳轉帶來的性能下降。即性能優化
2、作用:允许程序员将最有可能执行的分支告诉编译器。
3、指令的寫法為:__builtin_expect(EXP, N)
。表示EXP==N的概率很大。
4、fastpath定義中__builtin_expect((x),1)
表示x 的值为真的可能性更大;即執行if裡面語句的機會更大
5、slowpath定義中的__builtin_expect((x),0)
表示x 的值为假的可能性更大。即執行else裡面語句的機會更大
6、在日常的開發中,也可以通過設置來优化编译器,達到性能优化的目的,設置的路徑為:Build Setting--> Optimization Level--> Debug-->
將None
改為fastest
或者smallest
//x很可能为1,程式走if括弧內的實現
#define fastpath(x) (__builtin_expect(bool(x), 1))
//x很可能为0,程式走else括弧內的實現
#define slowpath(x) (__builtin_expect(bool(x), 0))
static ALWAYS_INLINE id
callAlloc(Class cls, bool checkNil, bool allocWithZone=false)// alloc 源码 第三步
{
#if __OBJC2__ //有可用的编译器优化
/*
参考链接:(https://www.jianshu.com/p/2684613a300f)
*/
// checkNil 为false,!cls 也为false ,所以slowpath 为 false,假值判断不会走到if里面,即不会返回nil
//fastpath(x)表示x很可能不為0,希望編譯器進行優化;slowpath(x)表示x很可能為0,希望編譯器進行優化-這裡表示cls大概率是有值的,編譯器可以不用每次都讀取return nil指令
if (slowpath(checkNil && !cls)) return nil;
//判断一个类是否有自定义的 +allocWithZone 实现,没有则走到if里面的实现
if (fastpath(!cls->ISA()->hasCustomAWZ())) {
return _objc_rootAllocWithZone(cls, nil);
}
#endif
// No shortcuts available. // 没有可用的编译器优化
if (allocWithZone) {
return ((id(*)(id, SEL, struct _NSZone *))objc_msgSend)(cls, @selector(allocWithZone:), nil);
}
return ((id(*)(id, SEL))objc_msgSend)(cls, @selector(alloc));
}
跳轉至
_objc_rootAllocWithZone
的源碼實現
id
_objc_rootAllocWithZone(Class cls, malloc_zone_t *zone __unused)// alloc 源码 第四步
{
// allocWithZone under __OBJC2__ ignores the zone parameter
//zone 參數不再使用 類創建實例內存空間
return _class_createInstanceFromZone(cls, 0, nil,
OBJECT_CONSTRUCT_CALL_BADALLOC);
}
跳轉至
_class_createInstanceFromZone
的源碼實現,這部分是alloc源碼的核心操作,該方法的實現主要分為三個部分
-
cls→instanceSize
:計算需要開闢的內存空間大小
-
calloc
:申請內存
,返回地址指針 -
obj→initInstanceIsa
:將類
與isa
關聯
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)// alloc 源码 第五步
{
ASSERT(cls->isRealized()); //检查是否已经实现
// Read class's info bits all at once for performance
//一次性读取类的位信息以提高性能
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
//计算需要开辟的内存大小,传入的extraBytes 为 0
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
//申请内存
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
//将 cls类 与 obj指针(即isa) 关联
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
alloc核心操作
- 核心操作都位於
calloc
方法中
cls->instanceSize:計算所需內存大小
流程
跳轉至
instanceSize
的源碼實現
size_t instanceSize(size_t extraBytes) const {
//编译器快速计算内存大小
if (fastpath(cache.hasFastInstanceSize(extraBytes))) {
return cache.fastInstanceSize(extraBytes);
}
// 计算类中所有属性的大小 + 额外的字节数0
size_t size = alignedInstanceSize() + extraBytes;
// CF requires all objects be at least 16 bytes.
//如果size 小于 16,最小取16
if (size < 16) size = 16;
return size;
}
- 經過斷點調適,執行
cache.hasFastInstanceSize
方法,快速計算內存大小。
跳轉至
fastInstanceSize
的源碼實現,通過斷點調適,來到align16
size_t fastInstanceSize(size_t extra) const
{
ASSERT(hasFastInstanceSize(extra));
//Gcc的内建函数 __builtin_constant_p 用于判断一个值是否为编译时常数,如果参数EXP 的值是常数,函数返回 1,否则返回 0
if (__builtin_constant_p(extra) && extra == 0) {
return _flags & FAST_CACHE_ALLOC_MASK16;
} else {
size_t size = _flags & FAST_CACHE_ALLOC_MASK;
// remove the FAST_CACHE_ALLOC_DELTA16 that was added
// by setFastInstanceSize
//删除由setFastInstanceSize添加的FAST_CACHE_ALLOC_DELTA16 8个字节
return align16(size + extra - FAST_CACHE_ALLOC_DELTA16);
}
}
跳轉到
align16
的源碼實現,以下是16字節對齊算法
//16字節對齊算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
想知道什麼是16字節對齊算法,請先參考
- 看完了內存對齊原理,了解為什麼要內存對齊後,我們來看看這個16字節對齊算法,為什麼是這樣寫呢?又代表了什麼意思?
為什麼要16字節對齊
- cpu存取數據時,以區塊來做範圍的讀取,如果讀取到的資料是沒有經過對齊的,資料讀取上就要花更多的次數讀取完成,意味著增加了cpu讀取時的負擔。
- 由於一個對象的本質為結構體,且第一個屬性為isa指針(佔8個字節),在沒有其他屬性的狀況下,會預留8個字節,其目的是為了數據讀取的安全性,如果不預留,有可能造成資料讀取混亂。
- 蘋果早期以8字節對齊,現在以16字節對齊。
16字節對齊算法
-
在解決為什麼16字節是這樣寫之前,我們先來看看C++的位元運算子
- 在這裡出現了AND(&)和NOT(~)兩個位元運算子,AND就是兩者數據為1時輸出1,其餘為0,NOT就是將1變0,0變1。
- 有了以上知識後,我們來看看
//16字節對齊算法
static inline size_t align16(size_t x) {
return (x + size_t(15)) & ~size_t(15);
}
calloc:申請內存,返回地址指針
- 通過
instanceSize
計算的內存大小,向內存中申請大小為size的內存,並賦值給obj,因此obj是指向內存地址的指針
obj = (id)calloc(1, size);
- 這裡我們可以通過斷點來印證上述的說法,在未執行calloc時,
po obj
為nil,執行後,再po obj
,返回了一個16進制的地址 - 然而在平常的開發中,一般一個對象的打印的格式都是類似於這樣的<LGPerson: 0x01111111f>(是一個指針)。為什麼這裡不是呢?
- 主要是因為
objc 地址
還沒有與傳入的cls
進行關聯 - 同時印證了
alloc
的根本作用就是開闢内存
obj->initInstanceIsa:類與isa關聯
- 經過calloc可知,內存已經申請好了,類也已經傳入進來了,接下來就需要將類與地址指針即isa指針進行關聯,其關聯的流程圖如下所示
類與isa關聯.png
initInstanceIsa流程
- 主要過程就是初始化一個isa指針,並將isa指針指向申請的內存地址,在將指針與cls類進行關聯
- 同樣也可以通過斷點調試來印證上面的說法,在執行完
initInstanceIsa
後,在通過po obj
可以得出一個對象指針
總結
- 通過對
alloc
源碼的分析,可以得知alloc的主要目的就是開闢內存
,而且開闢的內存需要使用16字節對齊算法
,現在開闢的內存的大小基本上都是16
的整數倍 - 開闢內存的核心步驟有3步:
計算 -- 申請 -- 關聯
init源碼探索
- alloc源碼探索完了,接下來探索init源碼,通過源碼可知,init的源碼實現有以下兩種
類方法init
+ (id)init {
return (id)self;
}
- 這裡的init是一個構造方法,是通過工廠設計(工廠方法模式),主要是用於給用戶提供構造方法入口。這裡能使用id強轉的原因,主要還是因為内存字节对齐後,可以使用類型強轉為你所需的類型
實例方法init
通過以下代碼進行探索實例方法init
LGPerson *objc = [[LGPerson alloc] init];
通過main中的init跳轉至init的源碼實現
- (id)init {
return _objc_rootInit(self);
}
跳轉至_objc_rootInit的源碼實現
id
_objc_rootInit(id obj)
{
// In practice, it will be hard to rely on this function.
// Many classes do not properly chain -init calls.
return obj;
}
有上述代碼可以,返回的是傳入的self本身。
new 源碼探索
一般在開發中,初始化除了init
,還可以使用new
,兩者本質上並沒有什麼區別,以下是objc中new的源碼實現,通過源碼可以得知,new函數中直接調用了callAlloc函數(即alloc中分析的函數),且調用了init函數,所以可以得出new 其实就等价于 [alloc init]
的結論
+ (id)new {
return [callAlloc(self, false/*checkNil*/) init];
}
但是一般開發中並不建議使用new,主要是因為有時會重寫init方法做一些自定義的操作,用new初始化可能會無法走到自定義的部分。