Block 底层原理

写在前面

Block 是 C 语言的扩充功能。可以用一句话来表示 Block 的扩充功能:带有自动变量(局部变量)的匿名函数。

基本概念

Block 定义

语法:^ 返回值类型 参数列表 表达式

^int(int count){
    retrun count + 1;
}

跟普通函数就两点不同

  • 没有函数名
  • 带有 ^

可以省略很多部分,省略返回类型:^ 参数列表 表达式

^(int count){
    retrun count + 1;
}

当没有参数的时候,参数列表也可以省略:^ 表达式

// 未省略参数列表
^(void){
    NSLog(@"done");
}

// 省略参数列表
^{
    NSLog(@"done");
}

Block 类型变量

先看一下 C 语言的函数指针

int func(int count) {
    retrun count + 1;
}

int (*funcptr)(int) = &func;

而 Block 类型变量为:int (^blk)(int),仅仅是把 * 改成 ^ 。

int (^blk)(int) = ^(int count){
    return count + 1;
};

Block 截获外部变量和 __block 修饰符

int global_val = 1;
static int global_static_val = 1;

int main(int argc, const char * argv[]) {
    int val = 1;
    static int static_val = 1;
    void(^blk)(void) = ^{
        NSLog(@"global_val:%d", global_val);
        NSLog(@"global_static_val:%d", global_static_val);
        NSLog(@"val:%d", val);
        NSLog(@"static_val:%d", static_val);
    };
    
    global_val++;
    global_static_val++;
    val++;
    static_val++;
    
    blk();
    
    return 0;
}

/*
打印如下:
global_val:2
global_static_val:2
val:1
static_val:2
*/

通过上面例子知道,全局变量和局部静态变量在 block 表达式中,可以直接修改的;

当我们需要修改自动变量值时,需要使用 __block 修饰,否则无法编译(__block 只能修饰局部自动变量

int main()
{
    __block int val = 1;
    void(^blk)(void) = ^{
        val++;
        NSLog(@"val:%d", val);
    };
    val++;
    blk();
    
    return 0;
}

/*
打印如下:
val:3
*/

底层实现

通过 clang -rewrite-objc main.m 解析下面源码

// ARC 环境
int main(int argc, const char * argv[]) {
    void(^blk)(void) = ^{
        NSLog(@"done");
    };
    blk();
    
    return 0;
}
struct __block_impl {
  void *isa;
  int Flags;
  int Reserved;
  void *FuncPtr; //指向 block 表达式的函数指针
};

// block 实现的结构体
struct __main_block_impl_0 {
    struct __block_impl impl;
    struct __main_block_desc_0* Desc;
    
    // 结构体初始化
    __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

//block 表达式的实现部分
static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_01adff_mi_0);
}

static struct __main_block_desc_0 {
    size_t reserved;
    size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

int main(int argc, const char * argv[]) {
    // 生成 __main_block_impl_0 结构体实例 blk
    void(*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA));
    
    // 通过结构体类的函数指针,调用block表达式部分
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    
    return 0;
}

这里可以得到一个结论:Block 底层是一个结构体实现。

再看看 clang 截获普通外部变量的结构

// ARC 环境

int global_val = 1;
static int global_static_val = 1;

int main(int argc, const char * argv[]) {
    int val = 1;
    static int static_val = 1;
    void(^blk)(void) = ^{
        NSLog(@"global_val:%d", global_val);
        NSLog(@"global_static_val:%d", global_static_val);
        NSLog(@"val:%d", val);
        NSLog(@"static_val:%d", static_val);
    };
    blk();
    
    return 0;
}
int global_val = 1;
static int global_static_val = 2;

struct __main_block_impl_0 {
    struct __block_impl impl;
    struct __main_block_desc_0* Desc;
    int val;         // 局部自动变量,值传递
    int *static_val; // 局部静态变量,指针传递
    __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, int _val, int *_static_val, int flags=0) : val(_val), static_val(_static_val) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    int val = __cself->val; // bound by copy
    int *static_val = __cself->static_val; // bound by copy
    
    // 全局变量直接访问
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_09c968_mi_0, global_val);
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_09c968_mi_1, global_static_val);
    
    // 局部变量,通过传递访问
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_09c968_mi_2, val);
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_09c968_mi_3, (*static_val));
}

static struct __main_block_desc_0 {
    size_t reserved;
    size_t Block_size;
} __main_block_desc_0_DATA = { 0, sizeof(struct __main_block_impl_0)};

int main(int argc, const char * argv[]) {
    int val = 3;
    static int static_val = 4;
    
    void(*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, val, &static_val));
    
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    
    return 0;
}

小结如下:

变量类型 访问方式 是否捕获到block内部
局部自动变量 值传递
局部静态变量 指针传递
全局变量 直接访问

继续看 __block 修饰的自动变量会是怎么样的

// ARC 环境
int main()
{
    __block int val = 1;
    void(^blk)(void) = ^{
        val++;
        NSLog(@"val:%d", val);
    };
    val++;
    blk();
    
    return 0;
}
// __block 修饰的变量 val,转换为结构体
struct __Block_byref_val_0 {
    void *__isa;
    __Block_byref_val_0 *__forwarding;
    int __flags;
    int __size;
    int val;
};

struct __main_block_impl_0 {
    struct __block_impl impl;
    struct __main_block_desc_0* Desc;
    __Block_byref_val_0 *val; // by ref
    __main_block_impl_0(void *fp, struct __main_block_desc_0 *desc, __Block_byref_val_0 *_val, int flags=0) : val(_val->__forwarding) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

static void __main_block_func_0(struct __main_block_impl_0 *__cself) {
    __Block_byref_val_0 *val = __cself->val; // bound by ref
    
    (val->__forwarding->val)++;
    NSLog((NSString *)&__NSConstantStringImpl__var_folders_47_6fxgzrp50fv6r72895k282k40000gn_T_main_bfcad8_mi_0, (val->__forwarding->val));
}

// 可以理解为 retain
static void __main_block_copy_0(struct __main_block_impl_0*dst, struct __main_block_impl_0*src) {
    _Block_object_assign((void*)&dst->val, (void*)src->val, 8/*BLOCK_FIELD_IS_BYREF*/);
}

// 可以理解为 release
static void __main_block_dispose_0(struct __main_block_impl_0*src) {
    _Block_object_dispose((void*)src->val, 8/*BLOCK_FIELD_IS_BYREF*/);
}

static struct __main_block_desc_0 {
    size_t reserved;
    size_t Block_size;
    void (*copy)(struct __main_block_impl_0*, struct __main_block_impl_0*);
    void (*dispose)(struct __main_block_impl_0*);
} __main_block_desc_0_DATA = { 
    0,
    sizeof(struct __main_block_impl_0), 
    __main_block_copy_0, 
    __main_block_dispose_0
};

int main()
{
    __attribute__((__blocks__(byref))) __Block_byref_val_0 val = {(void*)0,(__Block_byref_val_0 *)&val, 0, sizeof(__Block_byref_val_0), 1};
    void(*blk)(void) = ((void (*)())&__main_block_impl_0((void *)__main_block_func_0, &__main_block_desc_0_DATA, (__Block_byref_val_0 *)&val, 570425344));
    (val.__forwarding->val)++;
    ((void (*)(__block_impl *))((__block_impl *)blk)->FuncPtr)((__block_impl *)blk);
    
    return 0;
}

我们发现通过 __block 修饰的自定变量转换为 __Block_byref_a_0 结构体,而且多了一个 __forwarding 指针。在分析 __forwarding 之前,先分析一下 _NSConcreteStackBlock,Block 结构体中都会有一个 isa 指针指向 _NSConcreteStackBlock ,了解 objc 底层就会知道,isa 一般都是指向对象的所属类,也就是说 Blcok 也可以当做一个 objc 类理解。

在上面例子中出现的都是 _NSConcreteStackBlock,那么 _NSConcreteGlobalBlock_NSConcreteMallocBlock 是在什么条件生成的?

_NSConcreteGlobalBlock

void(^blk)(void) = ^{
    NSLog(@"done");
};

int main(int argc, const char * argv[]) {
    blk();
    return 0;
}

clang 之后

struct __blk_block_impl_0 {
    struct __block_impl impl;
    struct __blk_block_desc_0* Desc;
    __blk_block_impl_0(void *fp, struct __blk_block_desc_0 *desc, int flags=0) {
        impl.isa = &_NSConcreteGlobalBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

还有一种情况是,只要不截获自动变量就会分配到数据区域

int a = 1;

int main(int argc, const char * argv[]) {
    void(^blk)(void) = ^{
        NSLog(@"%d", a);
    };
    blk();
    return 0;
}

虽然通过 clang 转换为 _NSConcreteStackBlock,实际上却不同,可以通过断点打印验证;

总结起来就是:如果 Block 表达式中没有截获自动变量,那么 Block 的内存会分配在数据区域。

_NSConcreteStackBlock 与 _NSConcreteMallocBlock

如果不是分配在数据区域的对象,那么就是分配在栈上;至于堆上的 Block,需要对 Block 对象调用 copy 方法,才能移到堆上,ARC 下系统会在合适的时机自动移到堆上。

接下来分析,堆和栈的区别?以及系统在哪些情况下会自动移动到堆上?

  • 栈上的 Block:超过作用域就会释放
  • 堆上的 Block:通过引用计数管理
// MRC 环境下
+ (void)test
{
    int a = 1;
    void(^blk)(void) = ^{
        NSLog(@"%d", a);
    };
    NSLog(@"blk:%@", blk);
    NSLog(@"blk copy:%@", [blk copy]);
}

/*
打印如下:

blk:__NSStackBlock__
blk copy:__NSMallocBlock__
*/

小结如下:

内存区域 条件
_NSConcreteGlobalBlock(__NSGlobalBlock__) 数据区域(.data区) 表达式中没有截获自动变量
_NSConcreteStackBlock(__NSStackBlock__) 栈区 表达式中截获自动变量
_NSConcreteMallocBlock(__NSMallocBlock__) 堆区 __NSStackBlock__调用了copy

系统在哪些情况下会自动移动到堆上?这个需要分 MRC 和 ARC 的情况来考虑。

// ARC 环境
typedef int(^block)(int);

block getBlock(int rate)
{
    return ^(int count) {
        return rate * count;
    };
}

在 ARC 下通过编译器可转换如下:

block getBlock(int rate)
{
    // ARC 下会默认修饰符 __strong,block tmp = XXX; 相当于 __strong block tmp = XXX;
    block tmp = &__getBlock_block_impl_0((void *)__getBlock_block_func_0, &__getBlock_block_desc_0_DATA), rate);
    
    // 相当于普通 oc 对象的 objc_retain 函数;内部会调用 _Block_copy(tmp);
    tmp = objc_retainBlock(tmp); 
    
    // 把 tmp 注册到 autoreleasepool 中
    return objc_autoreleaseReturnValue(tmp);
}

_Block_copy 函数就是把 Block 从栈上复制到堆上。到这里就可以解释为什么 MRC 下,block 经常需要手动调用 copy,属性修饰符也一般都要使用 copy,比如:@property (nonatomic, copy) block blk;,主要目的是把 Block 从栈上拷贝到堆上。

ARC 自动 copy 到堆上的情况

  • Block 作为函数返回值时
  • 将 Block 赋值给 __strong 指针时
  • Block 作为 Cocoa API 中方法名含有 usingBlock 的方法参数时
  • Block 作为 GCD API 的方法参数时

有了这些做基础,接下来解释 __block 修饰的变量,生成的结构中 __forwarding 的作用了。

先说结论:通过 __forwarding 指针访问,保证每次都能访问到合适的内存。

当 block 还在栈上时,__forwarding 指向的是栈上的结构体对象;

Block_img_02.jpg

当 block 复制到堆上时,堆上的 __forwarding 指向堆上的结构体,栈上的 __forwarding 指向堆上的结构体

Block_img_01.jpg

所以通过 __forwarding->val 访问结构体中的值会永远都是合适的。

总结:Block 本质就是一个结构体,并且可以截获内部使用的自动变量作为结构体的成员变量。

几个注意的地方

循环引用问题

如果在 Block 中使用附有 __strong 修饰符的自动变量,那么当 Block 从栈复制到堆时,该对象为 Block 所强引用,这样就会引起循环引用。

先看一个经典例子

// ARC 环境
typedef void(^Block)(void);

@implementation ARCObject
{
    Block _blk;
    NSString *_str;
}

+ (void)test
{
    ARCObject *obj = [ARCObject new];
    obj->_str = @"string";
    obj->_blk = ^{
        NSLog(@"%@", obj->_str);
    };
    obj->_blk();
}

@end

clang 之后的结构体如下

struct __ARCObject__test_block_impl_0 {
    struct __block_impl impl;
    struct __ARCObject__test_block_desc_0* Desc;
    ARCObject *obj;  // 强引用
    __ARCObject__test_block_impl_0(void *fp, struct __ARCObject__test_block_desc_0 *desc, ARCObject *_obj, int flags=0) : obj(_obj) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

再看另一个经典例子,只访问了成员变量

// ARC 环境
typedef void(^Block)(void);

@implementation ARCObject
{
    Block _blk;
    NSString *_str;
}

- (void)test
{
    _str = @"string";
    _blk = ^{
        NSLog(@"%@", _str);
    };
    _blk();
}

@end

clang 之后的结构体如下

struct __ARCObject__test_block_impl_0 {
    struct __block_impl impl;
    struct __ARCObject__test_block_desc_0* Desc;
    ARCObject *self;  // 强引用整个对象
    __ARCObject__test_block_impl_0(void *fp, struct __ARCObject__test_block_desc_0 *desc, ARCObject *_self, int flags=0) : self(_self) {
        impl.isa = &_NSConcreteStackBlock;
        impl.Flags = flags;
        impl.FuncPtr = fp;
        Desc = desc;
    }
};

我们发现当 Block 访问的是对象的成员变量时,会把对象的指针传给 Block。

避免循环引用使用 __weak 修饰就可以了,比如上面列子,因为 __weak 是运行时添加的,所以没法 clang 出来。

// ARC 环境
typedef void(^Block)(void);

@implementation ARCObject
{
    Block _blk;
    NSString *_str;
}

- (void)test
{
    _str = @"string";
    __weak typeof(_str) weakStr = _str;
    _blk = ^{
        NSLog(@"%@", weakStr);
    };
    _blk();
}

@end

总结

现在就比较好理解:Block 是一个带有自动变量(局部变量)的匿名函数

  1. 通过一个结构体实现 Block,然后把 Block 表达式中使用的局部变量(局部自动变量、局部静态变量)设置为结构体的成员变量;
  2. Block 内存管理的方式,ARC 模式下,大部分情况编译器会自动帮我们完成从栈拷贝到堆上,然后通过引用计数管理 Block 对象。以下为编译器自动完成拷贝的情况:
    • Block 作为函数返回值时
    • 将 Block 赋值给 __strong 指针时
    • Block 作为 Cocoa API 中方法名含有 usingBlock 的方法参数时
    • Block 作为 GCD API 的方法参数时
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,919评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,567评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,316评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,294评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,318评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,245评论 1 299
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,120评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,964评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,376评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,592评论 2 333
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,764评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,460评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,070评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,697评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,846评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,819评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,665评论 2 354

推荐阅读更多精彩内容