在分析类的结构之前,我们需要先搞清楚类的内存分布情况。
类的内存分布
首先创建一个Person类:
// Person 类
@interface Person : NSObject
- (void)sayHello;
+ (void)sayHi;
@end
@implementation Person
- (void)sayHello {
NSLog(@"Say Hello");
}
+ (void)sayHi {
NSLog(@"Say Hi");
}
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
Person *person = [[Person alloc] init];
NSLog(@"%@",person);
}
return 0;
}
通过上图中可以看出 0x00000001000012e8
和 0x00000001000012c0
为什么打印出的结果都是 Person
呢?这个东西其实就是元类
。
那么什么是元类呢?
元类
每一个对象都对应一个类。
Person
类就是person
对象的类,换句话说就是person
对象的isa指针指向Person
对应的结构体;[Person class]
也是对象,描述它的类就是元类,换句话说[Person class]
对象的isa指向的就是元类
元类的定义和创建都是由编译器自动完成。
元类保存了类方法的列表。当一个类方法被调用时,元类会首先查找它本身是否有该类的方法的实现,如果没有则该类会向它的父类查找该方法,知道一直找到继承链的头。
从上图中我们可以看到,我们通过isa可以一直找到NSObject
类。通过 person
对象的isa指针可以找到Person
类,通过Person
的isa指针可以找到元类Person
,而通过元类Person
的isa指针又可以找元类Person
的元类NSObject
,通过元类NSObject
的isa指针找到的还是NSObject
,其实这个时候的NSObject
叫做根元类
但是NSObject
的类和 NSObject.class
的指针地址不一样呢?是NSObject类会在内存中存在多份吗?
我们通过如下代码打印来看下:
void getClassInfo() {
Class class1 = [Person class];
Class class2 = [Person alloc].class;
Class class3 = object_getClass([Person alloc]);
NSLog(@"\n%p\n%p\n%p\n",class1,class2,class3);
}
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
getClassInfo();
}
return 0;
}
输出结果如下:
2020-09-15 20:49:21.406345+0800 ObjectAnalysis[34085:811450]
0x1000012f0
0x1000012f0
0x1000012f0
Program ended with exit code: 0
可以看出其实类对象在整个内存中只有一份。
因此我们可以得出一个著名的isa的走位图。
isa的走位图&继承图
isa查找流程
-
实例对象
的isa指针类对象
-
类对象
的isa指向元类对象
-
元类对象
的isa指向根元类
-
根元类
的isa指向它自己本身
,从而形成了闭环
继承关系
类对象的继承关系
-
类
继承于它的父类
-
父类
继承它的父类
... - 直到找到
根类
,也就是NSObject
-
NSObject
则继承于nil
,这也就是所有的根源,即无中生有
元类的继承关系
-
子类的元类
继承与父类的元类
-
父类的元类
继承它的父类的元类
... - 直到找到
根元类
- 而
根元类
则是继承于NSObject
tips:实例对象
是没有继承关系的,只有类
才有继承关系
对象的本质
对象的本质其实就是结构体,而编译到底层都是继承自objc_class
的结构体
struct objc_class : objc_object {
// Class ISA;
Class superclass;
cache_t cache; // formerly cache pointer and vtable
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() const {
return bits.data();
}
// 代码过多,自动省略
...
};
// objc_object
struct objc_object {
private:
isa_t isa;
public:
// ISA() assumes this is NOT a tagged pointer object
Class ISA();
// rawISA() assumes this is NOT a tagged pointer object or a non pointer ISA
Class rawISA();
// getIsa() allows this to be a tagged pointer object
Class getIsa();
// 代码过多,自动省略
...
};
通过源码可以看出 objc_class
其实就是继承自 objc_object
。
所以我们可以看出所有的 对象
、类
和元类
都有isa指针,是因为都继承自 objc_object
,而 objc_object
中有个私有变量isa
。
objc_object、objc_class、isa、object、NSObject
的关系如下图所示:
我们接下来重点就是分析类的结构了
类的结构分析
再开始前,先分析下objc_class
的结构图
- isa 是指向元类的指针
- superclass 是指向当前类的父类
- cache 是用于缓存方法的,用于加速方法的调用
- bits 是存储类的方法、属性、协议等信息的地方
一般我们获取到bits
,然后才能获取到我们需要的信息,那么我们就需要进行32位指针的偏移,为什么是32位指针的偏移,请看下面的代码段分析:
struct objc_class : objc_object {
// Class ISA; // 指针占 8 字节
Class superclass; // 指针占 8 字节
cache_t cache; // 占 16 字节,具体分析,看cache_t 结构体的分析
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
class_rw_t *data() const {
return bits.data();
}
// 代码过多,自动省略
...
};
// mask_t 的定义
#if __LP64__
typedef uint32_t mask_t; // x86_64 & arm64 asm are less efficient with 16-bits
#else
typedef uint16_t mask_t;
#endif
// 结构体指针字节大小,看里面的成员变量,而大部分都是 static 和方法都不存在结构体里面
struct cache_t {
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_OUTLINED
explicit_atomic<struct bucket_t *> _buckets; // 结构体指针 8 字节
explicit_atomic<mask_t> _mask; // uint32_t 占 4 字节
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
explicit_atomic<uintptr_t> _maskAndBuckets;
mask_t _mask_unused;
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
explicit_atomic<uintptr_t> _maskAndBuckets;
mask_t _mask_unused;
#if __LP64__
uint16_t _flags; // 占 2 字节
#endif
uint16_t _occupied; // 占 2 字节
// 方法代码过多,自动省略
...
};
class_data_bits_t
在objc_class
结构体中的注释中已经写到class_data_bits_t
相当于class_rw_t
指针加上rr/alloc
的标志。
class_data_bits_t bits; // class_rw_t * plus custom rr/alloc flags
而在class_data_bits_t
结构体中为我们提供了一个用于返回其中的class_rw_t *
的方法
struct class_data_bits_t {
friend objc_class;
// Values are the FAST_ flags above.
uintptr_t bits;
// 代码过多,自动省略
...
public:
class_rw_t* data() const {
return (class_rw_t *)(bits & FAST_DATA_MASK);
}
// 代码过多,自动省略
...
};
class_rw_t
struct class_rw_t {
// Be warned that Symbolication knows the layout of this structure.
uint32_t flags;
uint16_t witness;
#if SUPPORT_INDEXED_ISA
uint16_t index;
#endif
explicit_atomic<uintptr_t> ro_or_rw_ext;
Class firstSubclass;
Class nextSiblingClass;
// 省略过多的代码
...
const method_array_t methods() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>()->methods;
} else {
return method_array_t{v.get<const class_ro_t *>()->baseMethods()};
}
}
const property_array_t properties() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>()->properties;
} else {
return property_array_t{v.get<const class_ro_t *>()->baseProperties};
}
}
const protocol_array_t protocols() const {
auto v = get_ro_or_rwe();
if (v.is<class_rw_ext_t *>()) {
return v.get<class_rw_ext_t *>()->protocols;
} else {
return protocol_array_t{v.get<const class_ro_t *>()->baseProtocols};
}
}
};
可以看出,我们可以通过class_rw_t
结构体中提供的methods()
、properties()
、protocols()
获取到对应的方法、属性和协议。
那么接下来我们通过lldb
调试来查找对应的class_data_bist_t bits
,查看相应的信息。
当我们获取到class_rw_t
结构体信息后,接下来想要获取到方法、属性或者协议,就需要通过调用其提供的方法来进行获取。
属性列表 properties()
- 1、通过
properties()
可以获取到对应的属性列表 - 2、通过get方法访问第一个属性,可以发现是我们定义的
name
属性
【error】但是尝试去获取第二个属性的时候,发现数组越界了,这是为什么呢?我们不是还定义了一个hobby
吗?
由此引出成员变量
、实例变量
和属性
的区别
成员变量/实例变量/属性
成员变量: Member Variable declarations
类: Class (description/template for an object)
实例: Instance (manifestation of a class)
消息: Message (sent to object to make it act)
方法: Method (code invoked by a Message)
实例变量: Instance Variable (object-specific storage)
超类/子类: Superclass/Subclass (Inheritance)
协议: Protocol (non-class-specific methods)
从上面的解释,可以看出,实例
是针对类
而言的,。实例是指类的声明,由此推理,实例变量是指由类声明的对象。
而属性和成员变量的区别在于有无setter、getter方法。
方法列表 methods()
我们还是先通过lldb
调试来查找方法列表。
通过上图的lldb调试过程,我们可以发现:
-
method_list_t
中有方法的总个数count=4
- 会优先存储我们定义的实例方法
- 会有一个隐藏的析构函数
.cxx_destruct
,实现ARC下自动释放内存的工作 -
setter
、getter
方法的存储
其实探索到这里,发现我们还遗留了两个问题:
1、成员变量的存储
2、类方法的存储
成员变量的存储
其实通过objc_class
的源码,我们可以知道里面其实还有个ro
方法,会返回一个class_ro_t
的结构体的信息。打印信息如下:
在class_ro_t
结构体中其实有很多的成员变量和方法,其实class_rw_t
中的ro
,在类的编译期就已经确定了属性、方法以及要遵循的协议,objc_class
中的bits
中的data部分存放了ro
信息。而在runtime
运行之后,准确的说是在运行runtime
的realizeClass
方法时,会生成class_rw_t
结构体,该结构体包含了class_ro_t
,并且更新了data部分。换成了class_rw_t
结构体的地址。
由上图的llbd
打印出的ivars
信息中,可以看到,我们生命的属性,也会在ivars
中生成一个 _name
的成员变量。这也就是我们为什么可以通过 _name
和self.name
来访问属性的原因了。
struct class_ro_t {
uint32_t flags;
uint32_t instanceStart;
uint32_t instanceSize;
#ifdef __LP64__
uint32_t reserved;
#endif
const uint8_t * ivarLayout;
const char * name;
method_list_t * baseMethodList;
protocol_list_t * baseProtocols;
const ivar_list_t * ivars;
const uint8_t * weakIvarLayout;
property_list_t *baseProperties;
// This field exists only when RO_HAS_SWIFT_INITIALIZER is set.
_objc_swiftMetadataInitializer __ptrauth_objc_method_list_imp _swiftMetadataInitializer_NEVER_USE[0];
_objc_swiftMetadataInitializer swiftMetadataInitializer() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
return _swiftMetadataInitializer_NEVER_USE[0];
} else {
return nil;
}
}
method_list_t *baseMethods() const {
return baseMethodList;
}
class_ro_t *duplicate() const {
if (flags & RO_HAS_SWIFT_INITIALIZER) {
size_t size = sizeof(*this) + sizeof(_swiftMetadataInitializer_NEVER_USE[0]);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
ro->_swiftMetadataInitializer_NEVER_USE[0] = this->_swiftMetadataInitializer_NEVER_USE[0];
return ro;
} else {
size_t size = sizeof(*this);
class_ro_t *ro = (class_ro_t *)memdup(this, size);
return ro;
}
}
};
类方法的存储
其实我们从上面的isa
走位图中就可以知道一点,所有的实例对象的isa
都是指向其元类
的,那么我们是否可以查看其元类
中的方法列表。下面我们通过lldb
调试来看一下。
所以可以看出对象中的类方法
都是存储在其元类
中的。