dyld与objc的关联分析

前言

在之前的文章dyld加载流程,我们已经探究了dyld的加载流程,那么接下来我们就对dyld又是如何与objc关联起来进行探究。

objc_init分析

首先我们对objc_init的源码进行分析

void _objc_init(void)
{
    static bool initialized = false;
    if (initialized) return;
    initialized = true;
    
    // fixme defer initialization until an objc-using image is found?
    //读取影响运行时的环境变量,如果需要,还可以打开环境变量帮助 export OBJC_HRLP = 1
    environ_init();
    //关于线程key的绑定,例如线程数据的析构函数
    tls_init();
    //运行C++静态构造函数,在dyld调用我们的静态析构函数之前,libc会调用_objc_init(),因此我们必须自己做
    static_init();
    //runtime运行时环境初始化,里面主要是unattachedCategories、allocatedClasses -- 分类初始化
    runtime_init();
    //初始化libobjc的异常处理系统
    exception_init();
    //缓存条件初始化
    cache_init();
    //启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
    _imp_implementationWithBlock_init();

    /*
     _dyld_objc_notify_register -- dyld 注册的地方
     - 仅供objc运行时使用
     - 注册处理程序,以便在映射、取消映射 和初始化objc镜像文件时使用,dyld将使用包含objc_image_info的镜像文件数组,回调 mapped 函数
     
     map_images:dyld将image镜像文件加载进内存时,会触发该函数
     load_images:dyld初始化image会触发该函数
     unmap_image:dyld将image移除时会触发该函数
     */
    _dyld_objc_notify_register(&map_images, load_images, unmap_image);

#if __OBJC2__
    didCallDyldNotifyRegister = true;
#endif
}

总结下来objc_init一共做了以下几件事 :

  • environ_init:初始化一系列环境变量,并读取影响运行时的环境变量
  • tls_init:关于线程key的绑定
  • static_init:运行C++静态构造函数(只会运行系统级别的构造函数),在dyld调用静态析构函数之前,libc会调用_objc_init
    *runtime_initruntime运行时环境初始化,里面操作是unattachedCategories、allocatedClasses(表的初始化)
  • exception_init:初始化libObjc的异常处理系统
  • cache_initcache缓存初始化
  • _imp_implementationWithBlock_init :启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载trampolines dylib
  • _dyld_objc_notify_registerdyld的注册

下面我们逐个分析

1. environ_init

点进去,发现代码很多,我们忽略其他的代码,只看其中的关键代码

void environ_init(void) 
{
 .....省略一些代码
if (PrintHelp  ||  PrintOptions) {
         .....省略一些代码
        for (size_t i = 0; i < sizeof(Settings)/sizeof(Settings[0]); i++) {
            const option_t *opt = &Settings[i];            
            if (PrintHelp) _objc_inform("%s: %s", opt->env, opt->help);
            if (PrintOptions && *opt->var) _objc_inform("%s is set", opt->env);
        }
    }
}

为了看环境变量的输出,我们直接将控制条件干掉

for (size_t i = 0; i < sizeof(Settings)/sizeof(Settings[0]); i++) {
        const option_t *opt = &Settings[I];
        _objc_inform("%s: %s", opt->env, opt->help);
        _objc_inform("%s is set", opt->env);
 }

运行,打印...

控制台输出如下:

objc[75885]: OBJC_PRINT_IMAGES: log image and library names as they are loaded
objc[75885]: OBJC_PRINT_IMAGES is set
objc[75885]: OBJC_PRINT_IMAGE_TIMES: measure duration of image loading steps
objc[75885]: OBJC_PRINT_IMAGE_TIMES is set
objc[75885]: OBJC_PRINT_LOAD_METHODS: log calls to class and category +load methods
objc[75885]: OBJC_PRINT_LOAD_METHODS is set
objc[75885]: OBJC_PRINT_INITIALIZE_METHODS: log calls to class +initialize methods
objc[75885]: OBJC_PRINT_INITIALIZE_METHODS is set
objc[75885]: OBJC_PRINT_RESOLVED_METHODS: log methods created by +resolveClassMethod: and +resolveInstanceMethod:
objc[75885]: OBJC_PRINT_RESOLVED_METHODS is set
objc[75885]: OBJC_PRINT_CLASS_SETUP: log progress of class and category setup
objc[75885]: OBJC_PRINT_CLASS_SETUP is set
objc[75885]: OBJC_PRINT_PROTOCOL_SETUP: log progress of protocol setup
objc[75885]: OBJC_PRINT_PROTOCOL_SETUP is set
objc[75885]: OBJC_PRINT_IVAR_SETUP: log processing of non-fragile ivars
.....

这里另外提一下你还可以通过终端指令export OBJC_help = 1输出环境变量,进行装13...

这些环境变量,均可以通过target -- Edit Scheme -- Run --Arguments -- Environment Variables配置,其中常用的环境变量主要有以下几个:

  • DYLD_PRINT_STATISTICS:设置 DYLD_PRINT_STATISTICS为YES,控制台就会打印 App 的加载时长,包括整体加载时长和动态库加载时长,即main函数之前的启动时间(查看pre-main耗时),可以通过设置了解其耗时部分,并对其进行启动优化
  • OBJC_DISABLE_NONPOINTER_ISA:杜绝生成相应的nonpointer isanonpointer isa指针地址 末尾为1 ),生成的都是普通的isa
  • OBJC_PRINT_LOAD_METHODS:打印ClassCategory+load方法的调用信息
  • NSDoubleLocalizedStrings:项目做国际化本地化(Localized)的时候是一个挺耗时的工作,想要检测国际化翻译好的语言文字UI会变成什么样子,可以指定这个启动项。可以设置 NSDoubleLocalizedStringsYES
  • NSShowNonLocalizedStrings:在完成国际化的时候,偶尔会有一些字符串没有做本地化,这时就可以设置NSShowNonLocalizedStringsYES,所有没有被本地化的字符串全都会变成大写

接下来我们以OBJC_DISABLE_NONPOINTER_ISA为例,展示一下环境变量的作用

在不设置环境变量OBJC_DISABLE_NONPOINTER_ISA 的时候,打印 personisa信息

LLDB展示如下

KCObjc was compiled with optimization - stepping may behave oddly; variables may not be available.
(lldb) x/4gx person
0x101006210: 0x001d800100002265 0x0000000000000000
0x101006220: 0x0000000000000000 0x0000000000000000
(lldb) p/t 0x001d800100002265  //注:p/t 二进制打印地址信息
(long) $1 = 0b0000000000011101100000000000000100000000000000000010001001100101

设置环境变量 OBJC_DISABLE_NONPOINTER_ISAYES,之后再次打印personisa 信息

设置环境变量

LLDB展示如下

KCObjc was compiled with optimization - stepping may behave oddly; variables may not be available.
(lldb) x/4gx person
0x10100a9b0: 0x0000000100002260 0x0000000000000000
0x10100a9c0: 0x0000000000000000 0x0000000000000000
(lldb) p/t 0x0000000100002260
(long) $1 = 0b0000000000000000000000000000000100000000000000000010001001100000

这里我们可以看到最后一位的变换:由 1 变为 0,在之前的文章isa结构分析中我们介绍过,最后一位就是 nonpointer 位,表示是否对 isa 指针开启指针优化。 0:纯 isa 指针;1:不止是类对象地址。isa 中包含了类信息、对象的引用计数等。

通过设置OBJC_DISABLE_NONPOINTER_ISA可以控制isa优化开关,从而优化整个内存结构

接下来我们再试试设置环境 OBJC_PRINT_LOAD_METHODS = YES,打印出项目中所有的load方法,控制台日志如下:

···省略一些打印
objc[76428]: LOAD: class 'NSApplication' scheduled for +load
objc[76428]: LOAD: class 'NSBinder' scheduled for +load
objc[76428]: LOAD: class 'NSColorSpaceColor' scheduled for +load
objc[76428]: LOAD: class 'NSNextStepFrame' scheduled for +load
objc[76428]: LOAD: category 'NSColor(NSUIKitSupport)' scheduled for +load
objc[76428]: LOAD: +[NSApplication load]

objc[76428]: LOAD: +[NSBinder load]

objc[76428]: LOAD: +[NSColorSpaceColor load]

objc[76428]: LOAD: +[NSNextStepFrame load]

objc[76428]: LOAD: +[NSColor(NSUIKitSupport) load]
···省略一些打印

2. tls_init:线程key的绑定

主要是本地线程池的初始化以及析构,源码如下

void tls_init(void)
{
#if SUPPORT_DIRECT_THREAD_KEYS//本地线程池,用来进行处理
    pthread_key_init_np(TLS_DIRECT_KEY, &_objc_pthread_destroyspecific);//初始init
#else
    _objc_pthread_key = tls_create(&_objc_pthread_destroyspecific);//析构
#endif
}

3. static_init

主要是运行系统级别的C++静态构造函数,在dyld调用我们的静态构造函数之前,libc调用_objc_init方法,即系统级别的C++构造函数 先于 自定义的C++构造函数 运行

static void static_init()
{
    size_t count;
    auto inits = getLibobjcInitializers(&_mh_dylib_header, &count);
    for (size_t i = 0; i < count; i++) {
        inits[i]();
    }
}

4. runtime_init

主要是运行时的初始化,主要分为两部分:分类初始化、的表初始化

void runtime_init(void)
{
    objc::unattachedCategories.init(32);  // 分类的初始化
    objc::allocatedClasses.init(); // 储存加载完毕的类的方法
}

5. exception_init

主要是初始化libobjc的异常处理系统,注册异常处理回调,从而监控异常的处理,我们可以通过设置回调函数来拦截异常信息

void exception_init(void)
{
    old_terminate = std::set_terminate(&_objc_terminate);
}

6. cache_init
主要是缓存初始化,源码如下

void cache_init()
{
#if HAVE_TASK_RESTARTABLE_RANGES
    mach_msg_type_number_t count = 0;
    kern_return_t kr;

    while (objc_restartableRanges[count].location) {
        count++;
    }
    //为当前任务注册一组可重新启动的缓存
    kr = task_restartable_ranges_register(mach_task_self(),
                                          objc_restartableRanges, count);
    if (kr == KERN_SUCCESS) return;
    _objc_fatal("task_restartable_ranges_register failed (result 0x%x: %s)",
                kr, mach_error_string(kr));
#endif // HAVE_TASK_RESTARTABLE_RANGES
}

7. _imp_implementationWithBlock_init

该方法主要是启动回调机制,通常这不会做什么,因为所有的初始化都是惰性的,但是对于某些进程,我们会迫不及待地加载libobjc-trampolines.dylib,其源码如下

void
_imp_implementationWithBlock_init(void)
{
#if TARGET_OS_OSX
    // Eagerly load libobjc-trampolines.dylib in certain processes. Some
    // programs (most notably QtWebEngineProcess used by older versions of
    // embedded Chromium) enable a highly restrictive sandbox profile which
    // blocks access to that dylib. If anything calls
    // imp_implementationWithBlock (as AppKit has started doing) then we'll
    // crash trying to load it. Loading it here sets it up before the sandbox
    // profile is enabled and blocks it.

    // 在某些进程中渴望加载libobjc-trampolines.dylib。一些程序(最著名的是嵌入式Chromium的较早版本使用的QtWebEngineProcess)启用了严格限制的沙箱配置文件,从而阻止了对该dylib的访问。如果有任何调用imp_implementationWithBlock的操作(如AppKit开始执行的操作),那么我们将在尝试加载它时崩溃。将其加载到此处可在启用沙箱配置文件之前对其进行设置并阻止它。
    // This fixes EA Origin (rdar://problem/50813789)
    // and Steam (rdar://problem/55286131)
    if (__progname &&
        (strcmp(__progname, "QtWebEngineProcess") == 0 ||
         strcmp(__progname, "Steam Helper") == 0)) {
        Trampolines.Initialize();
    }
#endif
}

8. _dyld_objc_notify_register

_dyld_objc_notify_register这个方法是跨库执行的,我们在dyld加载流程已经有详细说明,源码如下

//
// Note: only for use by objc runtime
// Register handlers to be called when objc images are mapped, unmapped, and initialized.
// Dyld will call back the "mapped" function with an array of images that contain an objc-image-info section.
// Those images that are dylibs will have the ref-counts automatically bumped, so objc will no longer need to
// call dlopen() on them to keep them from being unloaded.  During the call to _dyld_objc_notify_register(),
// dyld will call the "mapped" function with already loaded objc images.  During any later dlopen() call,
// dyld will also call the "mapped" function.  Dyld will call the "init" function when dyld would be called
// initializers in that image.  This is when objc calls any +load methods in that image.
//
void registerObjCNotifiers(_dyld_objc_notify_mapped mapped, _dyld_objc_notify_init init, _dyld_objc_notify_unmapped unmapped)
{
    // record functions to call
    sNotifyObjCMapped   = mapped;
    sNotifyObjCInit     = init;
    sNotifyObjCUnmapped = unmapped;

    // call 'mapped' function with all images mapped so far
    try {
        notifyBatchPartial(dyld_image_state_bound, true, NULL, false, true);
    }
    catch (const char* msg) {
        // ignore request to abort during registration
    }

    // <rdar://problem/32209809> call 'init' function on all images already init'ed (below libSystem)
    for (std::vector<ImageLoader*>::iterator it=sAllImages.begin(); it != sAllImages.end(); it++) {
        ImageLoader* image = *it;
        if ( (image->getState() == dyld_image_state_initialized) && image->notifyObjC() ) {
            dyld3::ScopedTimer timer(DBG_DYLD_TIMING_OBJC_INIT, (uint64_t)image->machHeader(), 0, 0);
            (*sNotifyObjCInit)(image->getRealPath(), image->machHeader());
        }
    }
}

我们通过上面的注释得出

  • 仅供objc运行时使用
  • 注册处理程序,以便在映射、取消映射初始化objc图像时调用
  • dyld将会通过一个包含objc-image-info的镜像文件的数组回调mapped函数

方法中的三个参数分别表示的含义如下:

map_images:dyld将image(镜像文件)加载进内存时,会触发该函数
load_image:dyld初始化image会触发该函数
unmap_image:dyld将image移除时,会触发该函数

dyld与Objc的关联

我们通过源码来体现它们之间的关联关系

首先是dyld源码实现

void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped)
{
  dyld::registerObjCNotifiers(mapped, init, unmapped);
}

然后是libobjc源码的调用

_dyld_objc_notify_register(&map_images, load_images, unmap_image);

我们得出结论

mapped 等价于 map_images
init 等价于load_images
unmapped 等价于 unmap_image

在上篇dyld加载流程中,我们知道了load_images是在notifySingle方法中,通过sNotifyObjCInit调用的,如下所示

notifySingle

然后我们在dyld源码中查找赋值 sNotifyObjCInit 的地方,可以找到是在 registerObjCNotifiers 函数中

void registerObjCNotifiers(_dyld_objc_notify_mapped mapped, _dyld_objc_notify_init init, _dyld_objc_notify_unmapped unmapped)
{
    // record functions to call
    sNotifyObjCMapped   = mapped;
    sNotifyObjCInit     = init;
    sNotifyObjCUnmapped = unmapped;
    
    // 省略代码......
}

继续查找 registerObjCNotifiers调用的地方,最终找到了

_dyld_objc_notify_register
void _dyld_objc_notify_register(_dyld_objc_notify_mapped    mapped,
                                _dyld_objc_notify_init      init,
                                _dyld_objc_notify_unmapped  unmapped)
{
    dyld::registerObjCNotifiers(mapped, init, unmapped);
}

所以这里就可以得出 dyld与 objc 直接的关联关系了,也就是

  • sNotifyObjCMapped == mapped == map_images;
  • sNotifyObjCInit == init == load_images;
  • sNotifyObjCUnmapped == unmapped == unmap_image;

至此,我们终于理清了它们真正的关联关系了。

map_images 的调用时机

接下来我们看看 map_images 的调用时机,也是一样的套路,我们搜索 sNotifyObjCMapped 函数指针是在哪里进行调用的

sNotifyObjCMapped调用

然后我们继续搜索 notifyBatchPartial 调用的地方,看到是在 registerObjCNotifiers 中进行调用的。

notifyBatchPartial调用

所以我们在这里可以得出

  • map_images 是在 registerObjCNotifiers 中进行调用
  • map_imagesload_images 先前调用。
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,826评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,968评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,234评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,562评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,611评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,482评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,271评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,166评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,608评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,814评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,926评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,644评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,249评论 3 329
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,866评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,991评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,063评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,871评论 2 354