前言
iOS
中每个OC对象
都有一个isa指针
,那么这个isa指针
又是什么呢,里面都有什么信息呢?
接下来让我们一起探索一下。
一、探索对象的本质
都说OC对象
的本质是结构体
,之前我们都是通过查看objc源码来判断对象的本质是结构体,那么有没有更直接的方式呢?
答案当然是有的,下面我们用一个例子来证明一下。
现在有一个main.m
文件,文件中的代码如下:
#import <Foundation/Foundation.h>
@interface WJPerson : NSObject
@property (nonatomic, copy) NSString *name;
@end
@implementation WJPerson
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
NSLog(@"Hello, World!");
}
return 0;
}
现在咱们把这个main.m
文件编译成c++
文件,看一下main.m
的底层实现。
首先咱们先打开终端,然后cd
进入到main.m
所在的文件目录,通过Clong
命令将main.m
文件编译成main.cpp
clang -rewrite-objc main.m -o main.cpp
这句命令的意思是把目标文件编译成c++
文件。接下来我们会看到这个目录下多出了一个main.cpp
文件
//2、将 ViewController.m 编译成 ViewController.cpp
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-13.0.0 -isysroot / /Applications/Xcode.app/Contents/Developer/Platforms/iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator13.7.sdk ViewController.m
//以下两种方式是通过指定架构模式的命令行,使用xcode工具 xcrun
//3、模拟器文件编译
- xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
//4、真机文件编译
- xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main- arm64.cpp
打开main.cpp
文件可以看到里面有将近12万行代码
,相信你们和我一样没有耐心一行一行的看,那么我们直接搜索关键内容来查看我们想要查看的代码。我们直接搜索WJPerson
,会看到以下代码:
#ifndef _REWRITER_typedef_WJPerson
#define _REWRITER_typedef_WJPerson
typedef struct objc_object WJPerson;
typedef struct {} _objc_exc_WJPerson;
#endif
extern "C" unsigned long OBJC_IVAR_$_WJPerson$_name;
struct WJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, copy) NSString *name;
/* @end */
// @implementation WJPerson
static NSString * _I_WJPerson_name(WJPerson * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$_WJPerson$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
static void _I_WJPerson_setName_(WJPerson * self, SEL _cmd, NSString *name) { objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct WJPerson, _name), (id)name, 0, 1); }
// @end
int main(int argc, const char * argv[]) {
/* @autoreleasepool */ { __AtAutoreleasePool __autoreleasepool;
NSLog((NSString *)&__NSConstantStringImpl__var_folders_1q_9d991v_j3bvfs3nvsmpq5_d40000gn_T_main_c1238e_mi_0);
}
return 0;
}
看着是不是特别熟悉,没错,这就是我们的main
方法和我们定义的类还有属性name
的getter
方法_I_WJPerson_name
、setter
方法_I_WJPerson_setName_
。从以上代码中可以看出我们的对象的定义是这部分
struct WJPerson_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
可以看到是由struct
修饰的,所以说对象的本质就是结构体。但是这里有一个问题,我们明明只定义了一个属性name
,这里为什么还有struct NSObject_IMPL NSObject_IVARS;
呢。我们知道c++
中的struct
的继承方式是struct
的第一个元素。我们来全局搜索下NSObject_IMPL
,会发现有下面这行代码
struct NSObject_IMPL {
Class isa;
};
由此可以得知WJPerson_IMPL
的第一个元素是一个isa指针
。从前文iOS alloc&init&new源码解析中得知OC会在alloc的时候会将类与isa指针进行绑定。那么到底是怎么进行绑定的呢,接下来让我们详细分析一下。
二、isa底层分析
从前文iOS alloc&init&new源码解析中得知OC会在这步obj->initInstanceIsa(cls, hasCxxDtor);
将类与isa指针进行关联绑定。
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
从上面代码中可以看出isa
是isa_t
的一个实例,接下来我们看下isa_t
的组成
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
可以看出isa_t
这里采用的是联合体&位域
的搭配。
为什么要用联合体呢,因为联合体有以下特点:
- 联合体中可以定义多个成员,联合体的大小由最大的成员大小决定
- 联合体的成员公用一个内存,一次只能使用一个成员
- 对某一个成员赋值,会覆盖其他成员的值
- 存储效率更高,可读性更强,可以提高代码的可读性,可以使用位运算提高数据的存储效率
所以苹果为了节省内存空间,这里使用了联合体的形式。
接下来我们看下isa_t
的位域
// arm64 真机
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
// x86_64 模拟器
# elif __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 8
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
# else
# error unknown architecture for packed isa
# endif
可以看到这里的位域区分arm64
架构和x86_64
架构,一般真机上我们使用的是arm64
架构,模拟器上我们使用的是x86_64
架构。
我们先来了解下位域下的每一位都存储的什么信息
-
nonpointer
:表示是否对 isa 指针开启指针优化
0:纯isa指针,1:不⽌是类对象地址,isa 中包含了类信息、对象的引⽤计数等 -
has_assoc
:关联对象标志位,0没有,1存在 -
has_cxx_dtor
:该对象是否有 C++ 或者 Objc 的析构器,如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象。 -
shiftcls
: 存储类指针的值。开启指针优化的情况下,在 arm64 架构中有 33 位⽤来存储类指针。 -
magic
:⽤于调试器判断当前对象是真的对象还是没有初始化的空间 -
weakly_referenced
:志对象是否被指向或者曾经指向⼀个 ARC 的弱变量,没有弱引⽤的对象可以更快释放。 -
deallocating
:标志对象是否正在释放内存 -
has_sidetable_rc
:当对象引⽤技术⼤于 10 时,则需要借⽤该变量存储进位 -
extra_rc
:当表示该对象的引⽤计数值,实际上是引⽤计数值减 1,
例如,如果对象的引⽤计数为 10,那么 extra_rc 为 9。如果引⽤计数⼤于 10,则需要使⽤到下⾯的 has_sidetable_rc。
为了更好的理解isa_t
的位域,咱们用图来表示下
arm64
为例,一个isa_t
代表一个64
位二进制,位域中的每个元素都顺序排放,所以得出如下结论
-
nonpointer
存储在二进制第一位:0
的位置 -
has_assoc
存储在二进制第二位:1
的位置 -
has_cxx_dtor
存储在二进制第三位:2
的位置 -
shiftcls
存储在二进制第四到三十六位:3~35
的位置 -
magic
存储在二进制第三十七到四十二位:36~41
的位置 -
weakly_referenced
存储在二进制第四十三位:42
的位置 -
deallocating
存储在二进制第四十四位:43
的位置 -
has_sidetable_rc
存储在二进制第四十五位:44
的位置 -
extra_rc
存储在二进制第四十六到六十四位:45~63
的位置
下面我们通过例子来了解下isa_t
存储的信息,位域下的其他信息我们不知道,但是我们可以知道当前创建的类的指针,而存储类指针的值的是shiftcls
,所以我们可以提前shiftcls
的值与类指针的值对比,看看结果。
首先我们先在main
函数中创建一个对象
int main(int argc, const char * argv[]) {
@autoreleasepool {
WJPerson *p = [[WJPerson alloc] init];
NSLog(@"%@",p);
}
return 0;
}
在WJPerson *p = [[WJPerson alloc] init];
这步打个断点
之后在这里再打个断点
isa
指针地址,然后我们就要获取shiftcls
的信息了经过上面的位移运算我们最后得到这样一个地址,按照上文所说这个地址就是
shiftcls
的信息了,也就是我们类的地址,接下来我们打印下类的地址来验证下这是我们通过源码一步步推导出来的,那么有没有快速获取的方式呢,苹果是怎么获取类的信息的呢
# define ISA_MASK 0x00007ffffffffff8ULL
inline Class
objc_object::ISA()
{
ASSERT(!isTaggedPointer());
#if SUPPORT_INDEXED_ISA
if (isa.nonpointer) {
uintptr_t slot = isa.indexcls;
return classForIndex((unsigned)slot);
}
return (Class)isa.bits;
#else
return (Class)(isa.bits & ISA_MASK);
#endif
}
看到return (Class)(isa.bits & ISA_MASK);
的地方了吗,这个地方返回的就是类的信息。我们再来验证一下
isa的指针&ISA_MASK
与我们之前得出的结论一模一样,由此我们可以得出对象在
alloc
的时候通过obj->initInstanceIsa(cls, hasCxxDtor);
或obj->initIsa(cls);
方法将 cls
类 与 obj
指针(即isa
) 关联。