iOS之武功秘籍⑤:cache_t分析

iOS之武功秘籍 文章汇总

写在前面

在上一篇文章中已经全面地介绍了类的结构,但是还剩下一个cache_t cache没有进行详细的介绍,本文就将从源码层面分析cache_t.

本节可能用到的秘籍Demo

一、初探cache_t

① cache_t结构

如下是在底层的结构

其中cache_t的结构如下

其中的_bucketsAndMaybeMask is a buckets_t pointer,是bucket_t类型的结构体指针.

从以上bucket_t的属性和方法中可以看出它应该与imp有联系——事实上bucket_t作为一个桶,里面是用来装imp方法实现以及它的key.
所以通过上面两个结构体源码可知,而我们cache中缓存的正好是sel-imp.
整体的结构如下图所示

在cache_t中查找sel-imp

cache_t中查找存储的sel-imp,有以下两种方式

  • 通过源码查找 -- LLDB调试
  • 脱离源码在项目中查找

准备工作

  • 定义一个TCJPerson类,并定义两个属性5个实例方法及其实现

  • main中定义TCJPerson类的对象person,并调用其中的3个实例方法,在person调用第一个方法处加一个断点

通过源码查找 一 LLDB调试

  • 运行执行,断在[person sayHello];部分,此时执行以下LLDB调试流程

  • cache属性的获取,需要通过pclass的首地址平移16字节(上篇文章讲过,类中isa指针占8字节,superclass指针占8字节),即首地址+0x10获取cache的地址

  • 从源码的分析中,我们知道sel-imp是在cache_t_buckets属性中(目前处于macOS环境),而在cache_t结构体中提供了获取_buckets属性的方法buckets()

  • 获取了_buckets属性,就可以获取sel-imp了,这两个的获取在bucket_t结构体中同样提供了相应的获取方法sel() 以及 imp(UNUSED_WITHOUT_PTRAUTH bucket_t *base, Class cls).

由上图可知,在没有执行方法调用时,此时的cache是没有缓存的,执行了一次方法调用,cache中就有了一个缓存,即调用一次方法就会缓存一次方法.

我们现在了解了如何获取cachesel-imp,如何验证打印的selimp就是我们调用的呢?可以通过machoView打开target的可执行文件,在方法列表中查看其imp的值是否是一致的,如下所示,发现是一致的,所以打印的这个sel-imp就是TCJPerson的实例方法

  • 接着上面的步骤,我们再次调用一个方法,这次我们想要获取第二个sel,其调试的LLDB如下

第一个调用方法的存储获取很简单,直接通过_buckets的首地址调用对应的方法即可,那么获取第二个呢?在之前的iOS之武功秘籍④:类结构分析文章中,曾提及过一个概念 指针偏移,所以我们这里可以通过_buckets属性的首地址偏移,即 p *($9+1)即可获取第二个方法的sel 和imp
如果有多个方法需要获取,以此类推,例如p *($9+i)

脱离源码通过项目查找

脱离源码环境,就是将所需的源码的部分拷贝至项目中,其完整代码如下

这里有个问题需要注意,在源码中,objc_classISA属性是继承自objc_object的,但在我们将其拷贝过来时,去掉了objc_class的继承关系,需要将这个属性明确,否则打印的结果是有问题,如下图所示

加上ISA属性后,增加两个方法的调用,其正确的打印结果应该是这样的

在增加两个方法的调用,即解开sayMastersayNA的注释,其打印结果如下

针对上面的打印结果,有以下几点疑问

  • 1、_mask是什么?
  • 2、_occupied 是什么?
  • 3、为什么随着方法调用的增多,其打印的occupiedmask会变化?
  • 4、bucket数据为什么会有丢失的情况?,例如调用四个方法时,只有sayMastersayNA方法有函数指针.

二、深入cache_t

找到切入点

  • 首先,从cache_t中的_mask属性开始分析,找cache_t中引起变化的函数,发现了incrementOccupied()函数

该函数的具体实现为
  • 源码中,全局搜索incrementOccupied()函数,发现只在cache_tinsert方法有调用

  • insert方法,理解为cache_t的插入,而cache中存储的就是sel-imp,所以cache的原理从insert方法开始分析,以下是cache原理分析的流程图

  • 全局搜索cache_t::insert,发现在写入之前,还有一步操作,即cache读取,即查找sel-imp,如下所示

insert方法分析

insert方法中,其源码实现如下

主要分为以下几部分

  • 【第一步】计算出当前的缓存占用量
  • 【第二步】根据缓存占用量判断执行的操作
  • 【第三步】针对需要存储的bucket进行内部imp和sel赋值

【第一步】计算出当前的缓存占用量

根据occupied的值计算出当前的缓存占用量,当属性未赋值及无方法调用时,此时的occupied()0,而newOccupied1,如下所示

关于缓存占用量的计算,有以下几点说明:

  • alloc申请空间时,此时的对象已经创建,如果再调用init方法,occupied也会+1
  • 有属性赋值时,会隐式调用set方法,occupied也会增加,即有几个属性赋值occupied会在原有的基础上加几个
  • 有方法调用时,occupied也会增加,即有几次调用,occupied会在原有的基础上加几个

【第二步】根据缓存占用量判断执行的操作

  • 如果是第一次创建,则默认开辟4

  • 如果缓存占用量小于等于3/4,则不作任何处理

  • 如果缓存占用量超过3/4,则需要进行两倍扩容以及重新开辟空间

reallocate方法:开辟空间

该方法,在第一次创建以及两倍扩容时,都会使用,其源码实现如图所示

主要有以下几步

  • allocateBuckets方法:向系统申请开辟内存,即开辟bucket,此时的bucket只是一个临时变量
    setBucketsAndMask方法:将临时bucket存入缓存中,此时的存储分为两种情况:
  • 如果是真机,根据bucketmask的位置存储,并将occupied占用设置为0
  • 如果不是真机,正常存储bucketmask,并将occupied占用设置为0
  • 如果有旧的buckets,需要清理之前的缓存,即调用collect_free方法,其源码实现如下

该方法的实现主要有以下几步:

  • _garbage_make_room方法:创建垃圾回收空间

    • 如果是第一次,需要分配回收空间
    • 如果不是第一次,则将内存段加大,即原有内存*2
  • 记录存储这次的bucket

  • cache_collect方法:垃圾回收,清理旧的bucket

【第三步】针对需要存储的bucket进行内部imp和sel赋值

这部分主要是根据cache_hash方法,即哈希算法 ,计算sel-imp存储的哈希下标,分为以下三种情况

  • 如果哈希下标的位置未存储sel,即该下标位置获取sel等于0,此时将sel-imp存储进去,并将occupied占用大小加1
  • 如果当前哈希下标存储的sel 等于 即将插入的sel,则直接返回
  • 如果当前哈希下标存储的sel 不等于 即将插入的sel,则重新经过cache_next方法 即哈希冲突算法,重新进行哈希计算,得到新的下标,再去对比进行存储

其中涉及的两种哈希算法,其源码如下

  • cache_hash:哈希算法
  • cache_next:哈希冲突算法

三、cache_t疑问点

① _mask是什么?

_mask是指掩码数据,用于在哈希算法或者哈希冲突算法中计算哈希下标,其中mask等于capacity - 1

② _occupied 是什么?

_occupied表示哈希表中 sel-imp 的占用大小 (即可以理解为分配的内存中已经存储了sel-imp的的个数)

  • init会导致occupied变化
  • 属性赋值,也会隐式调用set方法,导致occupied变化
  • 方法调用,会导致occupied变化
③ 为什么随着方法调用的增多,其打印的occupied 和 mask会变化?

因为在cache初始化时,分配的空间是4个,随着方法调用的增多,当存储的sel-imp个数,即newOccupied + CACHE_END_MARKER(等于1)的和 超过 总容量的3/4,例如有4个时,当occupied等于2时,就需要对cache的内存进行两倍扩容.

④ 为什么是在 3/4 时进行扩容

在哈希这种数据结构里面,有一个概念用来表示空位的多少叫做装载因子——装载因子越大,说明空闲位置越少,冲突越多,散列表的性能会下降

负载因子是3/4的时候,空间利用率比较高,而且避免了相当多的Hash冲突,提升了空间效率

具体可以阅读HashMap的负载因子为什么默认是0.75?

④ bucket数据为什么会有丢失的情况?

原因是在扩容时,是将原有的内存全部清除了,再重新申请了内存导致的

⑤ 方法缓存是否有序?

因为sel-imp的存储是通过哈希算法计算下标的,其计算的下标有可能已经存储了sel,所以又需要通过哈希冲突算法重新计算哈希下标,所以导致下标是随机的,并不是固定的

⑥ bucket与mask、capacity、sel、imp的关系
  • cls拥有属性cache_tcache_t中的buckets有多个bucket——存储着方法实现imp和方法编号sel强转成的keycache_key_t
  • mask对于bucket来说,主要是用来在缓存查找时的哈希算法
  • capacity则可以获取到cache_tbucket的数量

缓存的主要目的就是通过一系列策略让编译器更快的执行消息发送的逻辑

写在后面

和谐学习,不急不躁.我还是我,颜色不一样的烟火.

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 219,589评论 6 508
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,615评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 165,933评论 0 356
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,976评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,999评论 6 393
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,775评论 1 307
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,474评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,359评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,854评论 1 317
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,007评论 3 338
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,146评论 1 351
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,826评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,484评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,029评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,153评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,420评论 3 373
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,107评论 2 356

推荐阅读更多精彩内容