前言
- 我們知道類的本質是一個對象,對象的本質又是一個結構體,不過其中的原因以及類與對象之間的關聯,我們好好探究下。
Clang
- 介紹對象的本質前,由於要看編譯底層的C++文件,所以我們先來看看一個編譯器:
Clang
- clang是一個由Apple主導編寫,基於LLVM的C/C++/OC的编译器
對象的本質
- 興建一個project,定義一個類
LGPerson
,並在其中定義一個屬性name
。
@interface LGPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation LGPerson
@end
- 透過終端機下clang指令:
clang -rewrite-objc main.m -o main.cpp
//1、將 main.m 編譯為 main.cpp
clang -rewrite-objc main.m -o main.cpp
//2、將 ViewController.m 編譯為成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模擬器文件編譯
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真機文件編譯
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
- 即生成了.cpp的c++文件
- 我們打開這個文件,並且搜尋我們定義的類(LGPerson),可以看到是一個(struct)結構體
//LGPerson的聲明
@interface LGPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
//LGPerson的實現
@implementation LGPerson
@end
//經由clang編譯為C++,可以看到類對象本質是一個結構體
extern "C" unsigned long OBJC_IVAR_$_LGPerson$_name;
struct LGPerson_IMPL {
//LGPerson中的第一個屬性NSObject_IVARS等效於NSObject中的isa
struct NSObject_IMPL NSObject_IVARS;//等效于 Class isa;
NSString *_name;
};
- struct LGPerson_IMPL 的第一個屬性,就是isa,偽繼承自
NSObject
,偽繼承為直接將NSObject結構體定義為LGPerson中的第一个属性,意味著LGPerson擁有NSObject中的所有成员变量。
編譯後的@prorerty屬性
我們知道@property會執行三件事
生成一個私有屬性,屬性類型和@property類型一致,屬性的名稱和@property的名稱一致,屬性的名稱自動加一個下滑線。
生成這個屬性的getter setter方法的聲明
-
生成這個屬性的getter setter方法的實現
- setter的實現:直接將參數的值賦值給自動生成的私有屬性。
- getter的實現:直接返回生成的私有屬性的值。
透過編譯,可以看到@prorerty透過編譯器,將聲明的屬性,轉為set方法及get方法
static NSString * _I_LGPerson_name(LGPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_LGPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
static void _I_LGPerson_setName_(LGPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct LGPerson, _name), (id)name, 0, 1); }
而所有的
@prorerty
轉成的set方法都會走到objc_setProperty
這個方法,真正的實現則是在reallySetProperty
這個方法裡面我們可以透過源碼編譯,查看
objc_setProperty
→reallySetProperty
- 所有的set方法也都做了對新值retain對舊值進行release,也等於這部分的底層進行了一層接口的封裝。
補充:為何isa是class類型?
- 我們透過源碼逐步探索:
alloc
->_objc_rootAlloc
->callAlloc
->_objc_rootAllocWithZone
->_class_createInstanceFromZone
->initInstanceIsa
->isa_t
->Class ISA()
- NSObject定義中isa的類型是Class,其根本原因是由于isa對外反饋的是類信息,為了讓開發人員更加明確,需要在isa返回時做一個
類型強制轉換
,類似於swift中的 as 的強轉。源碼中isa的強轉如下圖所示。
總結
objc_setProperty
為一個接口,將傳入的set方法,及reallySetProperty
的實現進行關聯接口隔離層的目的為,當傳入的方法有很多時,如果沒有接口隔離層,就會產生許多臨時變量,查找sel時也較不方便。
於是乎蘋果提供了
適配器模式
(將底層接口適配為客戶端所需的接口),對上層傳入提供一個街口,對下層調用底層的set方法,使上下層不相互影響,達到接口隔離的目的。
cls與isa的關聯原理
- 在alloc&init源碼分析與內存對其原理中,提到了alloc的核心三步,那麼到底initInstanceIsa是如何將cls與isa關聯的?
- 在此之前,我們必須先瞭解聯合體,為什麼isa的類型isa_t是使用聯合體定義
結構體(struct) vs 聯合體(union)
-
union ( 共用體):構造數據類型,也叫聯合體
用途:使幾個不同類型的變量共佔一段內存(相互覆蓋)
優點:節約內存
缺點:包容性差
-
struct ( 結構體 ):是一種構造類型
用途: 把不同的數據組合成一個整體——自定義數據類型
優點:包容性比union好
缺點:較union耗費內存空間
-
主要區別:
struct和union都是由多個不同的數據類型成員組成, 但在任何同一時刻, union中只存放了一個被選中的成員; 而struct的所有成員都存在。在struct中,各成員都佔有自己的內存空間,它們是同時存在的,一個struct變量的總長度等於所有成員長度之和,遵從字節對齊原則; 在Union中,所有成員不能同時佔用它的內存空間,它們不能同時存在 , Union變量的長度等於最長的成員的長度。
對於union的不同成員賦值, 將會對其它成員重寫, 原來成員的值就不存在了,所以,共同體變量中起作用的成員是最後一次存放的成員; 而對於struct的不同成員賦值是互不影響的。
isa的類型isa_t
通過initInstanceIsa探索可以找到isa指針的類型isa_t的定義,從定義中可以看出是通過联合体(union)定義的。
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
//cls與bits兩者互斥,即只有一個會存在
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
isa_t
類型使用聯合体
的原因也是基於内存優化
的考慮,這裡的內存優化是指在isa指針中通過char + 位域
(即二進制中每一位均可表示不同的信息)的原理實現。通常來說,isa指针
佔用的內存大小是8
字節,即64
位,已經足夠存儲很多的信息了,這樣可以極大的節省內存,以提高性能,這樣的isa指針稱為nopointer_isa
且大部分自定義的類都是nopointer_isa
從isa_t
的定義中可以看出:
- 提供了兩個成員,
cls
和bits
,由聯合體的定義所知,這兩個成員是互斥
的,也就意味著,當初始化isa指針時,有兩種初始化方式- 通過
cls
初始化,bits无默认值
- 通過
bits
初始化,cls有默认值
- 通過
- 還提供了一個結構體定義的
位域
,用於存儲類信息及其他信息,結構體的成員ISA_BITFIELD
,這是一個宏
定義,有兩個版本__arm64__
(對應ios移動端)和__x86_64__
(對應macOS),以下是它們的一些宏定義,如下圖所示
原理探索
- 透過
alloc --> _objc_rootAlloc --> callAlloc --> _objc_rootAllocWithZone --> _class_createInstanceFromZone
方法路徑,查找到initInstanceIsa
,並進入其原理實現
- 此方法主要分為兩部分
1:透過cls初始化isa
2:通過bits初始化isa
證明指針位域
-
首先通過main中的LGPerson斷點--> initInstanceIsa--> initIsa-->走到else中的isa初始化
- 執行lldb指令:
p newisa
- 執行lldb指令:
- 點擊stepOver走到bits賦值後,再輸入一次
p newisa
比對newisa信息。
- 通過與前一個newsize的信息對比,發現isa指針中有一些變化,如下圖所示
- 為何magic為59?
isa與類關聯
-
cls
與isa
關聯原理就是isa指針中的shiftcls
位域中儲存了類信息,其中initInstanceIsa
的過程是將calloc指針和當前的類cls
關聯起來,有以下幾種驗證方式:- 驗證方式一:通過
initIsa
方法中的newisa.shiftcls = (uintptr_t)cls >> 3;
驗證 - 驗證方式二:通過
isa
指针地址與ISA_MSAK
的值&來
驗證 - 驗證方式三:通過runtime的方法
object_getClass
驗證 - 驗證方式四:通過
位運算
驗證
- 驗證方式一:通過
驗證方式一:
initIsa
運行至newisa.shiftcls = (uintptr_t)cls >> 3;
前一步,其中shiftcls
存儲當前类的值信息
- 此時查看
cls
,是LGPerson
類 -
shiftcls
賦值的邏輯是將LGPerson
進行編碼後,右移3
位
執行lldb命令p (uintptr_t)cls
,結果為(uintptr_t) $2 = 4294975896
,再右移三位,有以下兩種方式(任選其一),將得到536871987
存儲到newisa
的shiftcls
中
p (uintptr_t)cls >> 3
通過上一步的結果
$0 = 4294975896
,執行lldb命令p $0 >> 3
- 在執行到
isa = newisa
;部分,此時lldb
執行p newisa
打印newisa
的信息
驗證方式二:通過
isa
&ISA_MSAK
- 在方式一後,繼續執行,回到
_class_createInstanceFromZone
方法,此時cls 与 isa已经关联完成,執行po objc
- 執行
x/4gx obj
,得到isa指針的地址0x001d80010000219d
-
將
isa指針地址
&ISA_MASK
(處於macOS,使用x86_64中的宏定義),即
po 0x001d80010000219d & 0x00007ffffffffff8ULL
,得出LGPerson
而ISA_MASK就是進行了左移右移。
驗證方式三:通過object_getClass
通過查看object_getClass
的源碼實現,同樣可以驗證isa與類關聯的原理,有以下幾步:
- main中導入#import <objc/runtime.h>
- 通過
runtime
的api,即object_getClass
函數獲取類信息
- 查看object_getClass函數源碼的實現
- 點擊進入object_getClass底層實現
- 進入
getIsa
的源碼實現
- 點擊
ISA()
,進入源碼,可以看到如果是indexed類型,執行if流程,反之執行的是else流程
- 在else流程中,拿到isa的bits這個位,再& ISA_MASK,這與方式二中的原理是一致的,获得当前的类信息
- 從這裡也可以
得出 cls 与 isa 已经关联
方式四:通過位運算
- 回到
_class_createInstanceFromZone
方法。通過x/4gx obj
得到obj
的存儲信息,當前類的信息存儲在isa
指針中,且isa中的shiftcls
此時佔44
位(因為處於macOS
環境)
想要读取中間的44位类信息,就需要經過位运算,將右邊3位,和左邊除去44位以外的部分都抹零,其相对位置是不变的。其位運算過程如圖所示,其中shiftcls即為需要读取的类信息
-
將
isa
地址-
右移3
位:p/x 0x001d80010000219d >> 3
,得到0x0003b00020000433
- 將得到的
0x0003b00020000433<<左移20
位:p/x 0x0003b0002000041d << 20
,得到0x0002000043300000
- 為什麼是
左移20
位?因為先右
移了3
位,相當於向右偏移了3位
,而左边
需要抹零
的位數有17
位,所以一共需要移動20
位 - 得到的
0x0002000043300000
再右移17
位:p/x 0x0002000043300000 >> 17
得到新的0x0000000100002198
獲取cls的地址與上面的進行驗證:p/x cls
也得出0x00000001000020e8
,所以由此可以證明cls與isa是關聯的
-