本文源自本人的学习记录整理与理解,其中参考阅读了部分优秀的博客和书籍,尽量以通俗简单的语句转述。引用到的地方如有遗漏或未能一一列举原文出处还望见谅与指出,另文章内容如有不妥之处还望指教,万分感谢 !
关于TaggedPointer
- 从64bit开始,IOS引入了
Tagged Pointer
技术;用于优化NSNumber
、NSDate
、NSString
等小对象(OC对象
)的存储;
Tagged Pointer指针的值不再是地址了,而是真正的值。所以,实际上它不再是一个对象了,它只是一个披着对象皮的普通变量而已。所以,它的内存并不存储在堆中,也不需要malloc和free
在内存读取上有着3倍的效率,创建时比以前快106倍
NSString的内存管理主要分为3种
__NSCFConstantString
:字符串常量,是一种编译时常量,retainCount值很大,对其操作,不会引起引用计数变化,存储在字符串常量区
__NSCFString
:是在运行时创建的NSString子类,创建后引用计数会加1,存储在堆上
NSTaggedPointerString
:标签指针,是苹果在64位环境下对NSString、NSNumber等对象做的优化。对于NSString对象来说
比如:NSString 就会被优化成NSTaggedPointerString类型
注意:
Tagged Pointer
技术不会
运用在可变
类型对象,比如:NSMutableString
在没有使用
Tagged Pointer
之前,NSNumber等对象需要动态分配内存、维护引用计数等,NSNumber指针存储的是堆空间NSNumber对象的地址值
使用Tagged Pointer 技术之后,NSNumber指针里面存储的数据变成了:Tag+Data (Tag 是一个标记信息:数据类型),也就是NSNumber指针存储的是NSNumber
对象的数据
当对象指针地址的最高有效位是1,则该指针为
Tagged Pointer
比如:十六进制0x7 转换成二进制0b1110;十六进制0x6 转换成二进制0b1100;最左边数字是最高有效位 ;总体来说NSNumber
、NSDate
、NSString
内存地址十六进制最后一位是只要不是0,就是Tagged Pointer指针当指针不够存储这些数据是,才会使用动态分配内存的方式来存储数据;即将之前的直接动态分配内存,改变为先把数据加上tag值存储在指针中,如果不够再动态分配
Tagged Pointer
指针的赋值过程是不会走setter方法和getter方法的Tagged Pointer
是由编译器来实现,开发者全程无感
示例代码:
int main(int argc, char * argv[]) {
@autoreleasepool {
NSNumber *number = @10;
return UIApplicationMain(argc, argv, nil, NSStringFromClass([AppDelegate class]));
}
}
*图解:
- 十进制的10 转化成十六进制就是 0xa
优点:
- Tagged Pointer技术节省了内存空间开销,本来正常的局部变量的NSNumber指针占8字节,堆空间动态分配内存至少16字节;这样看来需要在两块内存区域分配共24字节;但是Tagged Pointer技术可以实现只在栈空间分配8字节就可以。
- 在方法调用方面也变的更简单,objc_msgSend能够识别Tagged Pointer,比如NSNumber的intValue方法,直接从指针提取数据,节省了以前的调用开销
示例代码二:
-(void)touchesBegan:(NSSet<UITouch *> *)touches withEvent:(UIEvent *)event
{
NSNumber *number1 = @10;
NSNumber *number2 = @11;
NSNumber *number3 = @12;
NSLog(@"\n %p \n %p \n %p", number1, number2, number3);
}
疑问:如何判断一个指针是否是Tagged Pointer ?
- iOS 平台,最高有效位是1 (第64bit)
- Mac平台,最低有效位是1
- 这里的有效位是二进制数
- 通过retainCount判断,如果retainCount是一个非常大的值那么就是Tagged Pointer类型,本质上这个值就是该指针地址转成的十进制数 (注意:这里十进制数值是通过 uintptr_t retain_count = (uintptr_t)this; 得到的,不是直接调用retainCount方法)
还有一个笨办法 !
让指针对象调用一个在编译阶段不报错,运行时就报错的方法;看崩溃日志......
比如:
如何区分内存地址是堆控件还是栈空间 ?
十六进制看最后一位是否是0,如果是0那就是堆空间地址;否则就是栈空间地址;
NSTaggedPointerString
Tagged Pointer
是一个很棒的技术,能把它运用在字符串上很不寻常。显然Apple花了很多心思在这上面,他们必须要看到一个显著的好处。看他们如何把这些技术融合在一起,看他们如何在非常有限的空间里面尽可能的存储信息,实在有趣。
做了什么 ?
利用有限的空间,把小数据存储在指针内部
有什么用 ?
- 提高访问速度,对性能提升很有帮助
- 节省了内存空间
- 简单来说:体量更小,🏃跑的更快 !
用什么编码方式实现 ?
NSTaggedPointerString
的存储有三种编码方式:ASCII码
,六位编码
,五位编码
。
ASCII码:除去第一位和最后一位,用8位的ascll码的话最多可以存储7个字符。字符串数目0~7
之间
六位编码: 六位二进制编码, (144)/6=9.333… ;最多存储9位字符。字符数目在8~9使用
五位编码:五位二进制编码,(144)/5 = 11.2;最多存储11位字符。字符数目在10~11使用
神秘的表:
完整的六位编码表是:
`eilotrm.apdnsIc ufkMShjTRxgC4013bDNvwyUL2O856P-B79AFKEWV_zGJ/HYX`
一个显然的问题是:为什么这个指令这么奇怪?
因为这个表同时用于六位编码和五位编码,它不完全按字母顺序排列是有意义的。最常使用的字符应该是上半部分,而较少使用的字符应该在下半部分。这可以确保尽可能多的长字符串可以使用五位编码。
表中前几个字母与字母出现在英语里的频率相似。最常见的英文字母是E,然后是T,A,O,I,N,S。E作为表的开头是正确的,其他的则靠近开头。表似乎是按使用频率排序。与英语的差异可能是因为Cocoa APP中的短字符串并不是一个从英语散文中随机选择的单词,而是更专业的语言。
但这并不是一成不变的,apple
会持续更新并统计字母使用频率,系统每次升级都可能不一样
,当前第一位是字母e,之后是i,l,o,t…;这两种编码是从左向右的;
根据编码位数我们显然也能推测出并不是所有字符都可以进行ASCII
或者六位五位编码
的,当出现这样不能编码(搜狗emoji
、颜文字
、符号表情
)的时候,系统也就不会使用NSTaggedPointerString类。
举例证明:
# define _OBJC_TAG_MASK (1UL<<63)
static inline bool objc_isTaggedPointer(const void * _Nullable ptr)
{
return ((uintptr_t)ptr & _OBJC_TAG_MASK) == _OBJC_TAG_MASK;
}
- (void)test10 {
NSString *string1 = [NSString stringWithFormat:@"💔💕"];
NSString *string2 = [NSString stringWithFormat:@"* ̄∇ ̄*)"];
NSString *string3 = [NSString stringWithFormat:@"222"];
BOOL isTagP1 = objc_isTaggedPointer((__bridge const void * _Nullable)(string1));
BOOL isTagP2 = objc_isTaggedPointer((__bridge const void * _Nullable)(string2));
BOOL isTagP3 = objc_isTaggedPointer((__bridge const void * _Nullable)(string3));
if (isTagP1) {
NSLog(@"✅✅✅ string1是TaggedPointer指针");
}else {
NSLog(@"❌❌❌ string1不是TaggedPointer指针");
}
if (isTagP2) {
NSLog(@"✅✅✅ string2是TaggedPointer指针");
}else {
NSLog(@"❌❌❌ string2不是TaggedPointer指针");
}
if (isTagP3) {
NSLog(@"✅✅✅ string3是TaggedPointer指针");
}else {
NSLog(@"❌❌❌ string3不是TaggedPointer指针");
}
}
❌❌❌ string1不是TaggedPointer指针
❌❌❌ string2不是TaggedPointer指针
✅✅✅ string3是TaggedPointer指针
### retainCount 的底层实现
inline uintptr_t objc_object::rootRetainCount() {
if (isTaggedPointer()) return (uintptr_t)this;
sidetable_lock();
isa_t bits = __c11_atomic_load((_Atomic uintptr_t *)&isa.bits, __ATOMIC_RELAXED);
if (bits.nonpointer) {
uintptr_t rc = bits.extra_rc;
if (bits.has_sidetable_rc) {
rc += sidetable_getExtraRC_nolock();
}
sidetable_unlock();
return rc;
}
sidetable_unlock();
return sidetable_retainCount();
}
开发中那些字符串符合TaggedPointer呢 ?
- 对于以前的@""符号创建的字符串还是常量字符串,这个没有改变,但是采用
stringWithFormat:
、stringWithUTF8String:
、stringWithString:
等NSString方法的创建字符串对象则有了区别。 - 用这些方法创建的字符串字符数目在
11位之内
的会被存储在TaggedPointer指针内部
参考优秀文章: