提问:
1.什么是Tagged Pointer?
2.为什么要引进Tagged Pointe?
3.Tagged Pointer有什么优势?
前言:
苹果从64bit开始,iOS就引入了Tagged Pointer技术,用于优化NSNumber,NSDate,NSString等小对象的存储。
我们首先看一下在没有使用Tagged Pointer之前,我们知道一个int = 10的类型的变量占4个字节,当我们要变成对象存储时,使用NSNumber去包装。那么就需要alloc去堆空间分配内存,创建一个NSNumber对象。number指针存储着指向堆空间中NSNumber的地址,然而搞了这么久就是为了存储一个10这个常量。OC对象创建最少是16个字节,number指针8个字节,那么就是24字节去存储,这样就很浪费内存。另外还要去维护NSNumber的引用计数。所以自然而然的就引进了Tagged Pointer技术。
在使用Tagged Pointer之后,NSNumber指针里面存储的数据变成了两部分:Tag + Data
,Tag
表示存储的是什么,Data
表示10这个存储的数据,也就是说直接将数据存储到指针当中
。
只有当指针不够存储数据的时候,才会使用动态分配内存的方式去存储数据
NSNumber *number1 = @1;
NSNumber *number2 = @2;
NSNumber *number3 = @4;
NSNumber *number4 = @(0xFFFFFFFFFFFFFFF);
NSLog(@"\n%p, \n%p, \n%p, \n%p",
number1,
number2,
number3,
number4);
打印出来的:
0x85a71efa4c777121,
0x85a71efa4c777221,
0x85a71efa4c777421,
0x1029448a0
由此我们可以看到number前三个跟第四个地址值是不一样的。而且我们可以观察到,我们去掉末尾的21,看到的不正是显示1,2,4的值吗!
所以我们可以知道Tagged Pointer指针存储的并不是一个地址,而是真正的值。既然它时一个值,那它就不是一个对象了,所以它的内存并不存在堆中。从number4也验证了,当它不够储存数据时,才会去分配内存的方式去存储数据
有人会问,既然它不是一个对象,那么number取值的时候,[number1 intValue]
取值是怎么取的,OC对象调用方法本质是发送消息,会转变成objc_msgSend()这个函数去发送消息。这个时候我们查看源码就可以发现在内部已经做了操作。
下面是runtime源码里面函数,判断是否是TaggedPointer:
/// MAC开发并且是64位环境
#if (TARGET_OS_OSX || TARGET_OS_IOSMAC) && __x86_64__
// 64-bit Mac - tag bit is LSB
# define OBJC_MSB_TAGGED_POINTERS 0
#else
// Everything else - tag bit is MSB
# define OBJC_MSB_TAGGED_POINTERS 1
#endif
#if OBJC_MSB_TAGGED_POINTERS
# define _OBJC_TAG_MASK (1UL<<63)
#else
# define _OBJC_TAG_MASK 1UL
#endif
static inline bool
_objc_isTaggedPointer(const void * _Nullable ptr)
{
return ((uintptr_t)ptr & _OBJC_TAG_MASK) == _OBJC_TAG_MASK;
}
因为我们是iOS,不是MAC开发,所以:OBJC_MSB_TAGGED_POINTERS = 1
,那么 _OBJC_TAG_MASK = (1UL<<63)
,那么_objc_isTaggedPointer
就可以变成
static inline bool
_objc_isTaggedPointer(const void * _Nullable ptr)
{
return ((uintptr_t)ptr & (1UL<<63)) == (1UL<<63);
}
传入地址值,通过&运算
,去判断是否是Tagged Pointer
我们再回到上面我们的number的地址值:
0x85a71efa4c777121,
0x85a71efa4c777221,
0x85a71efa4c777421,
0x1029448a0
----&(1UL<<63) 计算---------
0x1000000000000000000...
0x1000000000000000000...
0x1000000000000000000...
0x0000000000000000000...
这样不就验证了是否是Tagged Pointer。
而且当我们去赋值,取值的时候,直接识别Tagged Pointer,从指针中取值,节省了很多调用的开销。这样岂不是优化了很多。所以上面的三个问题自然就能能回答。
以此共勉,热爱生活!