首先,代码要运行肯定也必须要经过编译转换为机器语言才能执行,所以OC
代码最终执行的当然也是0
和1
表示的机器码。另外,我们一般认为OC
代码会先转化为C/C++
代码,然后再执行。实际在llvm
的工作中,是不是如我们所想,先将OC
转化为C/C++
,转再化为机器码执行,我目前不能确定,但从效率上来讲,没有必要多这一步,为啥不直接转为机器码?
研究OC
对象的本质也就是研究OC
对象转换为C++
之后的代码逻辑。例如,OC
对象在C++
里是什么结构表示的?数组,类,结构体还是其他什么结构。OC
类的继承功能,多态功能是怎么通过C++
实现的,这里的逻辑是什么。runtime
为什么可以给OC
的类添加方法,交换方法实现等等,这些功能在C++
里是怎么实现的?
如果我们要研究C
的机构体是怎么实现的,那么就要去读汇编了,汇编就是C
的底层逻辑。
还好,OC
的底层实现是C++
,毕竟还是人类可读的语言,没有读汇编那么痛苦。
这么看来,OC
有点像是C++
的一个语法糖,难以理解。为什么一个语言可以转换为另一个语言,我始终难以理解。
OC
的编译器是Clang
(LLVM
的一个前端模块),可以通过Clang
将OC
转换为C++
代码(如果可以通过头文件进去查看源代码也不需要重写这么麻烦)。要搞清楚,这里的C++
代码不是一种翻译,而是一种解析,类似于“反编译”。
Clang
将OC
代码解析为C++
代码的命令:
clang -rewrite-objc xxx.m -o xxx.cpp
上面的命令的意思是,将OC
文件xxx.m
转为C++
文件xxx.cpp
。但是没有指定平台和架构。
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc xxx.m -o xxx.cpp
我们一般用这个命令,生成的文件会比较小,因为限制了平台和架构。
先建一个最简单的工程,Command Line
工程:
在main.m
文件里加上两个最简单的类,Person
继承NSObject
,Teacher
继承Person
:
@interface Person : NSObject
{
NSString *_name;
}
@end
@implementation Person
@end
@interface Teacher : Person
{
NSString *_age;
}
@end
@implementation Teacher
@end
int main(int argc, const char * argv[]) {
@autoreleasepool {
// insert code here...
}
return 0;
}
通过clang
命令,生成C++
文件:
xcrun -sdk iphoneos clang -arch arm64 -rewrite-objc main.m -o xxx.cpp
打开xxx.cpp
文件,搜索Person
和Teacher
,可以找到下面的两个结构体,可以看到里面有我们定义的属性,由此可以推断,这个就是Person
和Teacher
的底层实现,并且Teacher
里可以找到父类Person
而Person
里面继承的父类当然就是NSObject
:
struct Person_IMPL {
struct NSObject_IMPL NSObject_IVARS;
NSString *_name;
};
struct Teacher_IMPL {
struct Person_IMPL Person_IVARS;
NSString *_age;
};
可以推测,NSObject
的底层实现是NSObject_IMPL
,找到其实现:
struct NSObject_IMPL {
Class isa;
};
所以,可以看到NSObject的本质就是一个结构体,里面只有一个成员变量isa
。那这个类的方法放在那里了呢?就在这个isa
指针里。
跳到Class
的定义里:
typedef struct objc_class *Class;
再看objc_class
结构体定义:
struct objc_class {
Class _Nonnull isa OBJC_ISA_AVAILABILITY;
#if !__OBJC2__
Class _Nullable super_class OBJC2_UNAVAILABLE;
const char * _Nonnull name OBJC2_UNAVAILABLE;
long version OBJC2_UNAVAILABLE;
long info OBJC2_UNAVAILABLE;
long instance_size OBJC2_UNAVAILABLE;
struct objc_ivar_list * _Nullable ivars OBJC2_UNAVAILABLE;
struct objc_method_list * _Nullable * _Nullable methodLists OBJC2_UNAVAILABLE;
struct objc_cache * _Nonnull cache OBJC2_UNAVAILABLE;
struct objc_protocol_list * _Nullable protocols OBJC2_UNAVAILABLE;
#endif
} OBJC2_UNAVAILABLE;
通过这些变量的名字,就可以猜到:
super_class
指向父类的指针
objc_ivar_list
成员变量列表
objc_method_list
方法列表
objc_protocol_list
协议列表
所以,NSObject
的底层结构是C++
的机构体,结构体里只存储成员变量,方法存储在isa指针指向的另外的地方。所以,方法不是不占内存,只不过是,没有存放在结构体里。