iOS原理探索07--objc_msgSend快速查找流程分析

本文主要分析一下objc_msgSend流程,那么在分析之前我们需要先了解一下什么是Runtime

Runtime简单介绍

Runtime有两个版本 ⼀个Legacy版本(早期版本) ,⼀个Modern版本(现⾏版本)

  • 早期版本对应的编程接⼝:Objective-C 1.0

  • 现⾏版本对应的编程接⼝:Objective-C 2.0

  • 早期版本⽤于Objective-C 1.0, 32位Mac OS X的平台上;

  • 现⾏版本:iPhone程序Mac OS X v10.5以后的系统中64 位程序;

  • 编译时: 顾名思义就是正在编译的时候,那啥叫编译呢?就是编译器帮你把源代码翻译成机器识别的代码

  • 运⾏时就是代码跑起来了,被装载内存中去了 ,(你的代码保存在磁盘上没装⼊内存之前是个死家伙。只有跑到内存中才变成活的),⽽运⾏时类型检查就与前⾯讲的编译时类型检查(或者静态类型检查)不⼀样,不是简单的扫描代码,⽽是在内存中做些操作、做些判断 。

  • runtime有以下三种实现方法与编译层

通过OC代码,例如 [person sayNB]
通过NSObject方法,例如isKindOfClass
通过Runtime API,例如class_getInstanceSize


runtime有以下三种实现方法与编译层

使用clang探索方法的本质

我们先使用person对象调用sayHello方法编译为cpp文件,来进行实例代码分析,下面一下main函数与main.cpp文件

//main.m中方法的调用
LGPerson *person = [LGPerson alloc];
[person sayNB];
[person sayHello];

//clang编译后的cpp文件底层实现
LGPerson *person = ((LGPerson *(*)(id, SEL))(void *)objc_msgSend)((id)objc_getClass("LGPerson"), sel_registerName("alloc"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayNB"));
((void (*)(id, SEL))(void *)objc_msgSend)((id)person, sel_registerName("sayHello"));

我们可以看出方法的调用,其实就是使用objc_msgSend消息发送,下面我们自己使用objc_msgSend发送消息来试试能否调用到sayNB方法,我们发现同样可以出发sayNB方法的实现。

  • 在实现下面方法之前我们需要注意的问题:
    1、直接调用objc_msgSend,需要导入头文件#import <objc/message.h>

    2、需要将target --> Build Setting -->搜索msg -- 将enable strict checking of obc_msgSend callsYES 改为NO,将严厉的检查机制关掉,否则objc_msgSend的参数会报错。

LGPerson *person = [LGPerson alloc];
objc_msgSend(person,sel_registerName("sayNB"));
  • 如果类的实例方法没找到会往上查找父类有没有实现,我们现在来验证一下这个问题
//前提条件:LGPerson只是声明了sayHello方法,父类LGTeacher有sayHello的具体实现;
LGPerson *person = [LGPerson alloc];
[person sayHello];


//objc_msgSendSuper方法中有两个参数(结构体,sel),其结构体类型是objc_super定义的结构体对象,且需要指定receiver 和 super_class两个属性

 struct objc_super lgsuper;
 lgsuper.receiver = person;
lgsuper.super_class = [LGTeacher class];

objc_msgSendSuper(&lgsuper, sel_registerName("sayHello"));

可以发现不管是[person sayHello],还是lgsuper父类的调用,sayHello方法有被调用,这就说明了方法的调用现在类中进行查找,如果类里面找不到就会去父类里面进行查找

objc_msgSend 快速查找流程分析

首先我们现在781源码中全局搜索一下objc_msgSend,我们选择arm64版本,进入ENTRY _objc_msgSend,可以看到objc_msgSend是用汇编实现的,使用汇编速度快效率高。

  • 汇编实现流程图
    来自简书style_月月
  • objc_msgSend汇编代码结合流程图的具体分析过程

  • _objc_msgSend实现

ENTRY _objc_msgSend
    UNWIND _objc_msgSend, NoFrame

//比较_objc_msgSend的消息接收者是否为空
    cmp p0, #0          // nil check and tagged pointer check  判断传入的是否为空
#if SUPPORT_TAGGED_POINTERS
//跳转
    b.le    LNilOrTagged        //  (MSB tagged pointer looks negative)
#else
    b.eq    LReturnZero
#endif
//获取isa表示从寄存器x0中取出isa存入p13寄存器
    ldr p13, [x0]       // p13 = isa
//即通过arm64架构通过isa&mask 获取到class即获取shiftcls位域的类信息
    GetClassFromIsa_p16 p13     // p16 = class
//获取isa完毕done
LGetIsaDone:
    // calls imp or objc_msgSend_uncached
    //开始缓存查找流程,即快速查找流程
    CacheLookup NORMAL, _objc_msgSend

#if SUPPORT_TAGGED_POINTERS
LNilOrTagged:
    b.eq    LReturnZero     // nil check

    // tagged
    adrp    x10, _objc_debug_taggedpointer_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_classes@PAGEOFF
    ubfx    x11, x0, #60, #4
    ldr x16, [x10, x11, LSL #3]
    adrp    x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGE
    add x10, x10, _OBJC_CLASS_$___NSUnrecognizedTaggedPointer@PAGEOFF
    cmp x10, x16
    b.ne    LGetIsaDone

    // ext tagged
    adrp    x10, _objc_debug_taggedpointer_ext_classes@PAGE
    add x10, x10, _objc_debug_taggedpointer_ext_classes@PAGEOFF
    ubfx    x11, x0, #52, #8
    ldr x16, [x10, x11, LSL #3]
    b   LGetIsaDone
// SUPPORT_TAGGED_POINTERS
#endif

LReturnZero:
    // x0 is already zero
    mov x1, #0
    movi    d0, #0
    movi    d1, #0
    movi    d2, #0
    movi    d3, #0
    ret

    END_ENTRY _objc_msgSend

【第一步】cmp p0, #0判断消息的接受者receiver是否为空;通过if SUPPORT_TAGGED_POINTERS判断是否支持taggedpointer(小对象类型)的流程,如果是返回空流程LReturnZero,否则处理小对象的isa流程LNilOrTagged
【第二步】通过ldr p13, [x0]获取isa表示从寄存器x0中取出isa存入p13寄存器,即GetClassFromIsa_p16 p13通过arm64架构isa&mask获取shiftcls位域的类信息,即class
【第三步】获取isa完毕doneLGetIsaDone,开始缓存查找流程,即快速查找流程CacheLookup NORMAL, _objc_msgSend

  • CacheLookup实现
.macro CacheLookup

LLookupStart$1:

    //通过isa平移16个字节获取到cache
    // p1 = SEL, p16 = isa
    ldr p11, [x16, #CACHE]              // p11 = mask|buckets

#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
    //通过掩码cache&0x0000ffffffffffff将高16位抹零,得到buckets
    and p10, p11, #0x0000ffffffffffff   // p10 = buckets
//p11(cache)右移48位,得到mask(即p11 存储mask),mask & p1(msgSend的第二个参数 cmd-sel) ,得到sel-imp的下标index(即搜索下标) 存入p12(cache insert写入时的哈希下标计算是 通过 sel & mask,读取时也需要通过这种方式)
    and p12, p1, p11, LSR #48       // x12 = _cmd & mask
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    and p10, p11, #~0xf         // p10 = buckets
    and p11, p11, #0xf          // p11 = maskShift
    mov p12, #0xffff
    lsr p11, p12, p11               // p11 = mask = 0xffff >> p11
    and p12, p1, p11                // x12 = _cmd & mask
#else
#error Unsupported cache mask storage for ARM64.
#endif

//p12, LSL#(1+PTRSHIFT)得到的就是从首地址开始的实际偏移量,存入到p12寄存器
//p12 = p10 + p12得到bucket存入p12寄存器中
//p12 = bucket
    add p12, p10, p12, LSL #(1+PTRSHIFT)
                     // p12 = buckets + ((_cmd & mask) << (1+PTRSHIFT))
//通过bucket结构体得到imp- sel即{imp, sel} = *bucket
//p9 = sel , p17 = imp
    ldp    p17, p9, [x12]        // {imp, sel} = *bucket

//判断查询的sel与objc_msgSend参数中传入的sel是否相等
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
//如果相等 即cacheHit 缓存命中,直接返回imp
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
//如果一直都找不到, 因为是normal ,跳转至__objc_msgSend_uncached
    CheckMiss $0            // miss if bucket->sel == 0
//判断当前的查询的bucket是否是buckets的第一个元素
    cmp p12, p10        // wrap if bucket == buckets
    //定位到最后一个元素(即第一个bucket)
    b.eq    3f
    //如果不是从最后一个元素开始往前查找{imp, sel} = *--bucket
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

3:  // wrap: p12 = first bucket, w11 = mask
#if CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_HIGH_16
//p11(mask)右移44位相当于(mask *bucket的大小 )即计算从首地址平移到最后一个bucket实际内存
//平移的大小,其中mask = buckets的总个数 - 1,直接定位到buckets的最后一个元素
//注意:缓存的查找是向前查找的,因为在arm64架构中,cache的写入是从后往前写入的
    add p12, p12, p11, LSR #(48 - (1+PTRSHIFT))
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#elif CACHE_MASK_STORAGE == CACHE_MASK_STORAGE_LOW_4
    add p12, p12, p11, LSL #(1+PTRSHIFT)
                    // p12 = buckets + (mask << 1+PTRSHIFT)
#else
#error Unsupported cache mask storage for ARM64.
#endif

    // Clone scanning loop to miss instead of hang when cache is corrupt.
    // The slow path may detect any corruption and halt later.
//再次递归为了防止多线程操作,刚好缓存进来
    ldp p17, p9, [x12]      // {imp, sel} = *bucket
1:  cmp p9, p1          // if (bucket->sel != _cmd)
    b.ne    2f          //     scan more
    CacheHit $0         // call or return imp
    
2:  // not hit: p12 = not-hit bucket
    CheckMiss $0            // miss if bucket->sel == 0
//判断p12(下标对应的bucket) 是否 等于 p10(buckets数组第一个元素),表示前面已经没有了但是还是没有找到
    cmp p12, p10        // wrap if bucket == buckets
    b.eq    3f
    ldp p17, p9, [x12, #-BUCKET_SIZE]!  // {imp, sel} = *--bucket
    b   1b          // loop

LLookupEnd$1:
LLookupRecover$1:
3:  // double wrap
//如果第二次递归还是找不到,即当前的bucket等于buckets的第一个元素,那么开启慢速查找
    JumpMiss $0

.endmacro

【快速查找流程第一步】ldr p11, [x16, #CACHE]通过isa平移16个字节获取到cache
【第二步】and p10, p11,通过掩码cache&0x0000ffffffffffff高16位抹零,得到buckets
【第三步】and p12, p1, p11, LSR #48p11(cache)右移48位,得到mask(即p11 存储mask),mask & p1(msgSend的第二个参数cmd-sel) ,得到sel-imp下标index(即搜索下标存入p12cache insert写入时的哈希下标计算是 通过sel & mask读取时也需要通过这种方式)。
【第四步】add p12, p10, p12, LSL #(1+PTRSHIFT)p12, LSL#(1+PTRSHIFT)得到的就是从首地址开始的实际偏移量,存入到p12寄存器p12 = p10 + p12得到bucket存入p12寄存器中,即p12 = bucket
【第五步】ldp p17, p9, [x12],通过bucket结构体得到imp- sel{imp, sel} = *bucket
【第六步】ldp p17, p9, [x12],通过bucket结构体得到imp- sel{imp, sel} = *bucket,p9 = sel , p17 = imp
【第七步】cmp p9, p1判断查询的selobjc_msgSend参数中传入的sel是否相等。
【第八步】如果相等缓存命中走cacheHit流程否则走CheckMiss流程。
【第九步】判断当前的查询的bucket是否是buckets的第一个元素,如果那么定位最后一个元素,即第一个bucket,进行第二次递归查找进行【第五步】;如果不是递归查找进行【第七步】。

  • CheckMiss实现
.macro CheckMiss
    // miss if bucket->sel == 0
.if $0 == GETIMP
//如果为GETIMP ,则跳转至 LGetImpMiss
    cbz p9, LGetImpMiss
.elseif $0 == NORMAL
//如果为NORMAL ,则跳转至 __objc_msgSend_uncached
    cbz p9, __objc_msgSend_uncached
.elseif $0 == LOOKUP
//如果为LOOKUP ,则跳转至 __objc_msgLookup_uncached
    cbz p9, __objc_msgLookup_uncached
.else
.abort oops
.endif
.endmacro

【if】如果为GETIMP ,则跳转至 LGetImpMiss;
【elseif】如果为NORMAL ,则跳转至__objc_msgSend_uncached
【elseif】如果为LOOKUP ,则跳转至 __objc_msgLookup_uncached

  • CacheHit实现
.macro CacheHit
.if $0 == NORMAL
    TailCallCachedImp x17, x12, x1, x16 // authenticate and call imp
.elseif $0 == GETIMP
    mov p0, p17
    cbz p0, 9f          // don't ptrauth a nil imp
    AuthAndResignAsIMP x0, x12, x1, x16 // authenticate imp and re-sign as IMP
9:  ret             // return IMP
.elseif $0 == LOOKUP
    // No nil check for ptrauth: the caller would crash anyway when they
    // jump to a nil IMP. We don't care if that jump also fails ptrauth.
    AuthAndResignAsIMP x17, x12, x1, x16    // authenticate imp and re-sign as IMP
    ret             // return imp via x17
.else
.abort oops
.endif
.endmacro

缓存命中返回imp

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。