iOS链接与Symbol

Mach-O是macOS、iOS、iPadOS存储程序和库的文件格式,对应的系统通过应用二进制接口(ABI--MachO内容的格式)来运行该格式的文件。保存了在编译过程和链接过程中产生的机器代码和数据。为静态链接和动态链接提供了单一的文件格式。

当我们点击Xcode Run的时候,系统会加载IPA包内的可执行文件,调用fork函数,创建一个进程,然后调用execve程序加载器,将文件加载到内存,分析MachO中的mach_header,以确认它是有效格式的MachO文件。

那么MachO到底是什么格式呢?如何查看MachO文件里面的内容,我们可以通过一个可视化的工具MachOView来查看,也可以通过objdump命令来查看objdump --macho --private-headers MachO文件路径,通过控制台输出或MachOView可以看到,它里面有Header、Load command还有一些Sections等,可以看出它其实就是有很多的配置项的二进制文件。

编译与链接:当我们写的代码进行编译的时候会生成一个个.o文件,也就是MachO文件,这个过程就是将代码放到对应的配置中,将各种类型的符号进行归类存放。而链接的本质就是把多个目标(.o)文件组合成一个可执行文件。把多个目标文件合并到一起,在合并的时候可以对其内部符号对外暴露的属性进行修改。

什么是符号?符号存放在哪里?符号的概念比较广,可以说我们编写的代码中的函数,变量等一切皆为符号,他们在MachO中保存在一个叫Symbol Table的东西内,除了Symbol Table(符号表)还有一个Indirect Symbol Table被称为间接符号表,它是符号表的一个子集,里面保存了引用的其他库的符号,如我们使用使用NSLog()函数,但是NSLog()的实现是在Foundation中,它就是一个外部符号,存放在间接符号表。

符号有哪些种类?我们可以亲自实操一下,生成一个MachO文件然后通过终端去查看或MachOView查看,假如我们使用MachOView会比较麻烦,所以我们先来了解一下如何实现xcode编译后自动实现在终端输出我们想要查看的MachO信息,首先了解一个命令tty,通过man tty命令查看return user's terminal name可以知道这个命令输出的是当前终端的名称。既然知道了终端的名称,那也就意味着我们可以通过重定向将结束输出到终端。

image.png

同样在xcode run script中我们也可以这么玩,我们写一个xcode_tty.sh脚本放到工作根目录,来让这个过程自动化,Run Script中执行sh $SRCROOT/xcode_tty.sh "${BUILT_PRODUCTS_DIR}/*" "/dev/ttys000"

#xcode_tty.sh脚本内容
#!/bin/sh
EchoError() {
    if [[ -n "$2" ]]; then
        echo "$@" 1>&2>$2
    else
        echo "$@" 1>&2
    fi
}
if [[ ! -e "$2" ]]; then
    EchoError "===ERROR: Not Config tty to output."
    exit -1
fi
#查看__TEXT
objdump --macho -d $1 1>$2
#查看mach-header
#objdump --macho --private-headers $1 1>$2
#查看符号类型
#`objdump --macho -syms $1 1>$2`
#查看导出符号表
#objdump --macho --exports-trie $1 1>$2
#查看间接符号表
#objdump --macho --indirect-symbols $1 1>$2

使用查看符号类型的命令输出结果中小写l代表本地符号,小写的g代表是全局符号,在main.m文件中定义几个变量运行 -syms命令,可以看出我们定义的变量是全局变量,而加了static之后就变成了本地变量,并且可以看出全局符号中未初始化的符号存放在__common段,已初始化的存放在__data段:

int cpy_inta = 10;
int cpy_intaa;
static int cpy_intb = 10;
static int cpy_inbb;
 d  *UND* _cpy_inta
0000000000000000 l    d  *UND* _cpy_inta
0000000000000000 l    d  *UND* _cpy_intaa
0000000100008018 g     O __DATA,__data _cpy_inta
0000000100008040 g     O __DATA,__common _cpy_intaa

使用objdump --macho --exports-trie $1 1>$2命令可以查看所有的导出符号,也就说,符号还也可以分导入符号和导出符号,其实导出符号也就是对应着全局符号,也就是说我们的全局符号是可以被别人使用的,但是全局符号并不一定全是导出符号,因为我们的链接器可以控制它是否可以导出。间接符号表保存着当前可执行文件使用的其他的库的符号,全局符号可以变成导出符号给别人使用,因此这个间接符号表是不能被删除,也就意味着所有的全局符号不能被删除,我们的OC方法默认都是全局符号,因此我们没有使用的OC类要进行删除,不然还会占用空间。其实链接器也提供了一个参数可以控制符号不被导出OTHER_LGFLAGS=$(inherited) -Xlinker -unexported_symbol -Xlinker ${符号}。追求极致的人可以通过链接器的此特性将使用的全局符号不需要被外部使用的全部设置为不导出,从而减小应用包的体积。-unexported_symbol_list可以指定一个文件进行批量处理。OTHER_LGFLAGS=$(inherited) -Xlinker -map -Xlinker 文件路径可以输出当前可执行文件使用的符号情况。

还有一个符号类型叫Weak Symbol,Weak defintion Symbol表示弱定义符号,如果链接器找到了另外一个非弱定义的符号,那么此弱定义符号将会被忽略,也就是说它就是个备胎。Weak Reference Symbol表示弱引用,如果链接器找不到该符号的定义,那么会将它置为0,使用if(弱引用) 相当于if(0)。

//弱定义示例
void weakDefineFunction(void) __attribute__((weak));
//弱引用示例
void weakImportFunction(void) __attribute__((weak_import));
  • 弱定义并不会影响它的全局属性和导出(如果将弱定义隐藏,它将变成一个本地符号),它的好处就是在别人导入它之后可以进行重写实现。如果多个文件中都写了弱定义的实现方法,那么将会按照顺序查找到第一个非弱定义的即停止。
  • 弱引用可以不实现,那么它在编译时并不会报错。但是在链接时会产生报错undefined symbol,可以通过链接器参数-U来告诉链接器它没有定义,需要运行时动态查找,示例OTHER_LGFLAGS=$(inherited) -Xlinker -U -Xlinker _weakImportFunction。另外链接器还有一个-undefined的参数,它默认指定未定义时error,还有warning,dynamic_lookup,假如我们将找不到的符号全部声明成dynamic_lookup那么程序将再也不会报错了,全部变成了动态查找,当然在正常开发中千万不要这么乱搞。在运行时如果找不到定义它就是0。

Swift符号与OC不太一样,swift是一种静态语言,它的符号类型根据关键字public/private来区分,使用public则是全局符号,使用private可以变成本地符号,因此swift中的关键字一定要合理的使用。

另外还有一种re-export符号,它是将引用的外部符号重新导出。

了解了符号之后,我们才能更好的去理解Strip剥离符号。xcode提供的Strip Style有三种分别是All Symbol、Non-Global Symbol、Debugging Symbol,究竟该如何使用?

  • 对于动态库,因为是要导出给别人使用,所以它的所有的全局符号都不能被脱掉,使用Non-Global Symbol
  • 对于静态库,它是.o文件的合集,它的符号全部都放在重定位符号表中,在链接时需要使用,因此它不能被脱掉,只有调试符号才能被脱掉,使用Debugging Symbol
  • 对于App,它根本不需要导出给别人使用,因此不管是本地符号、全局符号还有弱定义符号都可以干掉,所以在app上架是通常使用All Symbol,另外即使是All Symbol也不会脱掉间接符号表中的符号。

app使用静态库的符号最终会合并放到app内,也就意味着静态库的符号会变成了app内的本地、全局、导出等符号,因此最终也会被干掉,总的符号会变少。而动态库则只能增加符号,总的符号会变多。符号多寡也就影响包的体积。

Debugging Symbol:静态库的调试符号是存放在MachO文件的一个__DWARF的Segment中,DWARF全称Debugging With Attributed RecordFormats。符号剥离的过程为:MachO文件解析成模型Object,然后通过遍历LoadCommands,找到Segname==__DWARF的LoadCommand,移除里面的section,再从符号表中移除Symbol,最后将修改后的模型Object重新写入MachO,因此说我们的MachO文件是一个可读写的文件。Strip就是修改MachO文件。而动态库它是没有__DWARF的段,它是遍历符号表,将n_type包含N_STAB(0xe0)的全部删除,N_STAB(0xe0)代表调试符号。

All Symbol:遍历符号,只要不是间接符号表中的符号,全部删除
Non-Global Symbols:遍历符号表,判断n_type!= N_EXT都可以删除,N_EXT代表外部符号

Dead code Strip是链接器的一个参数,它是用来剥离死代码,将没有用到的函数和数据干掉,Xcode中默认是YES。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,313评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,369评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,916评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,333评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,425评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,481评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,491评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,268评论 0 269
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,719评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,004评论 2 328
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,179评论 1 342
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,832评论 4 337
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,510评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,153评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,402评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,045评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,071评论 2 352

推荐阅读更多精彩内容