对象的本质
在分析isa
前,先分析一下我们常见的接触最多的——对象。为了探究OC对象的本质是什么,就有必要了解Clang
。
Clang是⼀个C语⾔、C++、Objective-C语⾔的轻量级编译器。源代码发布于BSD协议下。Clang将⽀持其普通lambda表达式、返回类型的简化处理以及更好的处理constexpr关键字。Clang是⼀个由Apple主导编写,基于LLVM的C/C++/Objective-C编译器。
-
利用Clang解析OC文件
将OC代码通过Clang命令解析,就能探究OC对象低层是怎样的一个数据形式。用到的命令:clang -rewrite-objc main.m -o main.cpp
,目的是将目标文件编译成C++的文件,这是基于OC文件的一种编译方式,如果要对UIKit框架下的UI文件比如ViewController.m
。
// 模拟器sdk路径替换自己的即可
clang -rewrite-objc -fobjc-arc -fobjc-runtime=ios-12.0.0 -isysroot /
Applications/Xcode.app/Contents/Developer/Platforms/
iPhoneSimulator.platform/Developer/SDKs/iPhoneSimulator12.0.sdk ViewController.m
xcode
安装的时候顺带安装了xcrun
命令,xcrun
命令在clang
的基础上进⾏了
⼀些封装,要更好⽤⼀些
xcrun -sdk iphonesimulator clang -arch arm64 -rewrite-objc main.m -o main-arm64.cpp
-- iPhoneSimulator
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o main�arm64.cpp
-- iPhone
通过搜索定义的对象名
// 对象的本质——结构体
struct Book_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
// @property (nonatomic, copy) NSString *bookName;
/* @end */
// @implementation Book
static NSString * _I_Book_name(Book * self, SEL _cmd) { return (*(NSString **)((char *)self + OBJC_IVAR_$Book$_name)); }
extern "C" __declspec(dllimport) void objc_setProperty (id, SEL, long, id, bool, bool);
static void _I_Book_setName_(Book * self, SEL _cmd, NSString *name) {
objc_setProperty (self, _cmd, __OFFSETOFIVAR__(struct Book, _name), (id)name, 0, 1);
}
// @end
对象:对象的本质是结构体。
联合体位域(union)
再来稍稍剖析下联合体位域。联合体位域的目的是为了优化存储空间,节省内存。
当多个数据需要共享内存或者多个数据每次只取其一时,可以利用联合体(union):
1)联合体是一个结构;
2)它的所有成员相对于基地址的偏移量都为0;
3)此结构空间要大到足够容纳最"宽"的成员;
使用位域的主要目的是压缩存储,其大致规则为:
如果相邻位域字段的类型相同,且其位宽之和小于类型的sizeof大小,则后面的字段将紧邻前一个字段存储,直到不能容纳为止;
如果相邻位域字段的类型相同,但其位宽之和大于类型的sizeof大小,则后面的字段将从新的存储单元开始,其偏移量为其类型大小的整数倍;
如果相邻的位域字段的类型不同,则各编译器的具体实现有差异,VC6采取不压缩方式,Dev-C++采取压缩方式;
如果位域字段之间穿插着非位域字段,则不进行压缩;
结构体总大小为最大对齐数的整数倍。
比如定义一个车的类,它有前后左右的属性,每一个属性就是占4个字节,4 x 4 = 16字节 x 8位 = 128位,这样就浪费存储空间。如果优化一下,使用联合体位域,通过0: NO, 1: YES
这样的形式来存储前后左右,那它就能用1个字节存储下来。
// car.h
@interface Car : NSObject
@property (nonatomic, assign) BOOL front;
@property (nonatomic, assign) BOOL back;
@property (nonatomic, assign) BOOL left;
@property (nonatomic, assign) BOOL right;
// 对象 - 属性
// 存储 : 1字节 = 8位 0000 1111 char + 位域 bit 结构体
- (void)setFront:(BOOL)isFront;
- (BOOL)isFront;
- (void)setBack:(BOOL)isBack;
- (BOOL)isBack;
@end
// car.m
#import "Car.h"
#define DirectionFrontMask (1 << 0)
#define DirectionBackMask (1 << 1)
#define DirectionLeftMask (1 << 2)
#define DirectionRightMask (1 << 3)
// ISA 8字节 64 信息 性能
// 2^64
@interface Car(){
// 联合体
union {
char bits;
// 位域
struct { // 0000 1111
char front : 1;
char back : 1;
char left : 1;
char right : 1;
};
} _direction;
}
@end
@implementation Car
- (instancetype)init
{
self = [super init];
if (self) {
// 使它们有相同的基地址
_direction.bits = 0b0000000000;
}
return self;
}
- (void)setFront:(BOOL)isFront {
if (isFront) {
// 如果向前,_direction.bits | DirectionFrontMask,则代表得到向前为真 ,有了新的 _direction.bits = 0b0000000001;
_direction.bits |= DirectionFrontMask;
} else {
// 否则,_direction.bits = 0b0000000000;
_direction.bits |= ~DirectionFrontMask;
}
NSLog(@"%s",__func__);
}
- (BOOL)isFront{
return _direction.front;
}
- (void)setBack:(BOOL)isBack {
_direction.back = isBack;
NSLog(@"%s",__func__);
}
- (BOOL)isBack{
return _direction.back;
}
@end
通过对基地址进行左移的形式,将其4个结构体成员所代表的信息,用一个字节就表达了,苹果大量采用了这样的编码方式。
isa的分析
利用之前的objc781源码工程进行底层isa
的分析:
alloc -> _objc_rootAlloc -> callAlloc -> _objc_rootAllocWithZone -> _class_createInstanceFromZone
会进入以下的代码
static ALWAYS_INLINE id
_class_createInstanceFromZone(Class cls, size_t extraBytes, void *zone,
int construct_flags = OBJECT_CONSTRUCT_NONE,
bool cxxConstruct = true,
size_t *outAllocatedSize = nil)
{
ASSERT(cls->isRealized());
// Read class's info bits all at once for performance
bool hasCxxCtor = cxxConstruct && cls->hasCxxCtor();
bool hasCxxDtor = cls->hasCxxDtor();
bool fast = cls->canAllocNonpointer();
size_t size;
size = cls->instanceSize(extraBytes);
if (outAllocatedSize) *outAllocatedSize = size;
id obj;
if (zone) {
obj = (id)malloc_zone_calloc((malloc_zone_t *)zone, 1, size);
} else {
obj = (id)calloc(1, size);
}
if (slowpath(!obj)) {
if (construct_flags & OBJECT_CONSTRUCT_CALL_BADALLOC) {
return _objc_callBadAllocHandler(cls);
}
return nil;
}
if (!zone && fast) {
obj->initInstanceIsa(cls, hasCxxDtor);
} else {
// Use raw pointer isa on the assumption that they might be
// doing something weird with the zone or RR.
obj->initIsa(cls);
}
if (fastpath(!hasCxxCtor)) {
return obj;
}
construct_flags |= OBJECT_CONSTRUCT_FREE_ONFAILURE;
return object_cxxConstructFromClass(obj, cls, construct_flags);
}
其中 initInstanceIsa, initIsa
就发现isa
踪迹;继续跟入:
inline void
objc_object::initInstanceIsa(Class cls, bool hasCxxDtor)
{
ASSERT(!cls->instancesRequireRawIsa());
ASSERT(hasCxxDtor == cls->hasCxxDtor());
initIsa(cls, true, hasCxxDtor);
}
inline void
objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
{
ASSERT(!isTaggedPointer());
if (!nonpointer) {
isa = isa_t((uintptr_t)cls);
} else {
ASSERT(!DisableNonpointerIsa);
ASSERT(!cls->instancesRequireRawIsa());
// 初始化
isa_t newisa(0);
#if SUPPORT_INDEXED_ISA
// iOS系统下走这
ASSERT(cls->classArrayIndex() > 0);
newisa.bits = ISA_INDEX_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
newisa.has_cxx_dtor = hasCxxDtor;
newisa.indexcls = (uintptr_t)cls->classArrayIndex();
#else
// newisa 就是一个联合体,对bits进行默认赋值
newisa.bits = ISA_MAGIC_VALUE;
// isa.magic is part of ISA_MAGIC_VALUE
// isa.nonpointer is part of ISA_MAGIC_VALUE
//
newisa.has_cxx_dtor = hasCxxDtor;
newisa.shiftcls = (uintptr_t)cls >> 3;
#endif
// This write must be performed in a single store in some cases
// (for example when realizing a class because other threads
// may simultaneously try to use the class).
// fixme use atomics here to guarantee single-store and to
// guarantee memory order w.r.t. the class index table
// ...but not too atomic because we don't want to hurt instantiation
isa = newisa;
}
}
分析这段代码,isa = isa_t((uintptr_t)cls);
这段代码是一个关键点,进入isa_t
:
union isa_t {
isa_t() { }
isa_t(uintptr_t value) : bits(value) { }
Class cls;
uintptr_t bits;
#if defined(ISA_BITFIELD)
struct {
ISA_BITFIELD; // defined in isa.h
};
#endif
};
ISA_BITFIELD; // defined in isa.h
终于看到了isa的定义文件,进入发现了下面的代码:
// 针对iOS系统时的isa
# if __arm64__
# define ISA_MASK 0x0000000ffffffff8ULL
# define ISA_MAGIC_MASK 0x000003f000000001ULL
# define ISA_MAGIC_VALUE 0x000001a000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 33; /*MACH_VM_MAX_ADDRESS 0x1000000000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 19
# define RC_ONE (1ULL<<45)
# define RC_HALF (1ULL<<18)
// 针对macOS系统时的isa
# elif __x86_64__
# define ISA_MASK 0x00007ffffffffff8ULL
# define ISA_MAGIC_MASK 0x001f800000000001ULL
# define ISA_MAGIC_VALUE 0x001d800000000001ULL
# define ISA_BITFIELD \
uintptr_t nonpointer : 1; \
uintptr_t has_assoc : 1; \
uintptr_t has_cxx_dtor : 1; \
uintptr_t shiftcls : 44; /*MACH_VM_MAX_ADDRESS 0x7fffffe00000*/ \
uintptr_t magic : 6; \
uintptr_t weakly_referenced : 1; \
uintptr_t deallocating : 1; \
uintptr_t has_sidetable_rc : 1; \
uintptr_t extra_rc : 8
# define RC_ONE (1ULL<<56)
# define RC_HALF (1ULL<<7)
# else
# error unknown architecture for packed isa
# endif
// SUPPORT_PACKED_ISA
#endif
这就是isa
的结构,在iOS和macOS有这不同的字节占比,却有着相同的定义:
nonpointer:
表示是否对 isa 指针开启指针优化,0:纯isa指针,1:不⽌是类对象地址,isa 中包含了类信息、对象的引⽤计数等;
has_assoc:
关联对象标志位,0没有,1存在;
has_cxx_dtor:
该对象是否有 C++ 或者 Objc 的析构器,如果有析构函数,则需要做析构逻辑, 如果没有,则可以更快的释放对象;
shiftcls:
存储类指针的值。开启指针优化的情况下,在 arm64 架构中有 33 位⽤来存储类指针;
magic:
⽤于调试器判断当前对象是真的对象还是没有初始化的空间;
weakly_referenced:
志对象是否被指向或者曾经指向⼀个 ARC 的弱变量,没有弱引⽤的对象可以更快释放;
deallocating:
标志对象是否正在释放内存;
has_sidetable_rc:
当对象引⽤技术⼤于 10 时,则需要借⽤该变量存储进位;
extra_rc:
当表示该对象的引⽤计数值,实际上是引⽤计数值减 1,
例如,如果对象的引⽤计数为 10,那么 extra_rc 为 9。如果引⽤计数⼤于 10,则需要使⽤到下⾯的 has_sidetable_rc。
通过以下图片可以更加形象的理解isa
的结构:
其中我们需要关注的是shiftcls
,它存储的事类指针的值,事关整个类的关键信息。可以通过调试objc源码工程进行实操。
- newisa 初始化
进入到inline void objc_object::initIsa(Class cls, bool nonpointer, bool hasCxxDtor)
,这个方法中,下一个断点
利用LLDB调试,打印一些信息
(lldb) x cls
0x1000020e8: c0 20 00 00 01 00 00 00 40 41 33 00 01 00 00 00 . ......@A3.....
0x1000020f8: 10 e4 32 00 01 00 00 00 00 00 00 00 10 80 00 00 ..2.............
(lldb) x/4gx cls
0x1000020e8: 0x00000001000020c0 0x0000000100334140
0x1000020f8: 0x000000010032e410 0x0000801000000000
(lldb) p newisa
(isa_t) $2 = {
cls = nil
bits = 0
= {
nonpointer = 0
has_assoc = 0
has_cxx_dtor = 0
shiftcls = 0
magic = 0
weakly_referenced = 0
deallocating = 0
has_sidetable_rc = 0
extra_rc = 0
}
}
x == memory read : 打印内存情况 ; x/4gx :用4行的形式打印内存;
这是刚开始创建的newisa
信息情况,当它执行了上图中newisa.bits = ISA_MAGIC_VALUE;
之后,newisa
就有了新的值:
(isa_t) $4 = {
cls = 0x001d800000000001
bits = 8303511812964353
= {
nonpointer = 1
has_assoc = 0
has_cxx_dtor = 0
shiftcls = 0
magic = 59
weakly_referenced = 0
deallocating = 0
has_sidetable_rc = 0
extra_rc = 0
}
}
cls
不再为nil,bits中的成员也有了初始值,其中的magic = 59
,二进制是11 1011
;它对应16进制下64位中的47 ~ 52中的值:
-
关联isa指针与类
newisa.shiftcls = (uintptr_t)cls >> 3;
这个执行的操作就是将(uintptr_t)cls
右移三位,再打印它的信息验证一下,newisa
的信息就与类关联起来了。
(lldb) p (uintptr_t)cls
(uintptr_t) $7 = 4294975720
(lldb) p $5 >> 3
(uintptr_t) $8 = 536871965
(lldb) p newisa
(isa_t) $9 = {
cls = LGPerson
bits = 8303516107940073
= {
nonpointer = 1
has_assoc = 0
has_cxx_dtor = 0
shiftcls = 536871965
magic = 59
weakly_referenced = 0
deallocating = 0
has_sidetable_rc = 0
extra_rc = 0
}
}
将isa返回赋值到obj:
在这个页面继续LLDB调试,打印obj对象信息,在打印它的内存信息,其实:
0x001d8001000020e9
就是这个类的isa信息,通过窥探isa
的源码,我们有两种方式获得LGPerson类关联,return (Class)(isa.bits & ISA_MASK);
,执行这段代码同样能得出类信息。
inline Class
objc_object::ISA()
{
ASSERT(!isTaggedPointer());
#if SUPPORT_INDEXED_ISA
if (isa.nonpointer) {
uintptr_t slot = isa.indexcls;
return classForIndex((unsigned)slot);
}
return (Class)isa.bits;
#else
return (Class)(isa.bits & ISA_MASK);
#endif
}
(lldb) po obj
<LGPerson: 0x101305150>
(lldb) x/4gx 0x101305150
0x101305150: 0x001d8001000020e9 0x0000000000000000
0x101305160: 0x00007fff8b974738 0x000000010063eff0
(lldb) po 0x001d8001000020e9 & 0x00007ffffffffff8ULL
LGPerson
- 通过位移预算再验证类信息
根据之前分析的isa结构,其中shiftcls
存储的就是类的信息,那么就可根据isa指针,通过向右位移3位,再向左位移17 + 3 = 20,再通过右位移17还原出isa地址中shiftcls
信息,这个计算的操作就是为了将isa其他位上的信息进行抹零处理,得到了第 3 ~ 46的信息。(iOS为3~35)
(lldb) x/4gx 0x101305150
0x101305150: 0x001d8001000020e9 0x0000000000000000
0x101305160: 0x00007fff8b974738 0x000000010063eff0
(lldb) p/x 0x001d8001000020e9 >> 3
(long) $13 = 0x0003b0002000041d
(lldb) p/x 0x0003b0002000041d << 20
(long) $14 = 0x0002000041d00000
(lldb) p/x 0x0002000041d00000 >> 17
(long) $15 = 0x00000001000020e8
(lldb) p/x cls
(Class) $16 = 0x00000001000020e8 LGPerson
// 验证了cls的信息与位移后的结果