LLVM具有强大的模块间优化功能,可以在链接时使用。链接时优化(LTO)就是指在链接时进行模块间的优化。本文介绍了LTO优化器与链接器在接口上的设计。
链接器使用libLTO
(共享对象)来处理LLVM位代码文件(bitcode)。链接器和LLVM优化器之间的紧密集成有助于进行其他模型不可能实现的优化。
LTO示例
以下示例说明了LTO的集成方法的优点。这个例子需要一个系统链接器,它通过本文描述的接口支持LTO。使用clang调用系统链接器。
- 源文件
a.c
被编译成LLVM 位代码格式 - 源文件
main.c
被编译成原生的目标文件
--- a.h ---
extern int foo1(void);
extern void foo2(void);
extern void foo4(void);
--- a.c ---
#include "a.h"
static signed int i = 0;
void foo2(void) {
i = -1;
}
static int foo3() {
foo4();
return 10;
}
int foo1(void) {
int data = 0;
if (i < 0)
data = foo3();
data = data + 42;
return data;
}
--- main.c ---
#include <stdio.h>
#include "a.h"
void foo4(void) {
printf("Hi\n");
}
int main() {
return foo1();
}
运行一下命令开始编译:
% clang -flto -c a.c -o a.o # <-- a.o 是一个bitcode文件
% clang -c main.c -o main.o # <-- main.o 是原生目标文件
% clang -flto a.o main.o -o main # <-- 使用 -flto 将两个.o文件链接
- 在这个例子中,链接器会发现函数
foo2()
在LLVM bitcode文件中被定义为一个外部可见的符号,当链接器使用pass对此符号进行处理时会发现函数foo2()
从来没被调用过,此时LLVM优化器会将foo2()
移除。 - 正如
foo2()
被移除时一样,优化器同时也能观察到条件i<0
永远为false
,这意味着函数foo3
也永远不会被调用。因此,优化器也会移除foo3()
。 - 同样的,由于
foo3()
被移除,链接器也会移除foo4()
。
这个例子演示了LTO的优点,而在没有链接的参与下,优化器是没办法确定函数foo3()
是否应该被移除的。
libLTO与linker链接器的多阶段通信
链接器收集有关符号定义的信息,并在各种链接对象中使用。链接器通过查看本地.o文件中符号的定义和使用以及使用符号可见性来收集这些信息。链接器还使用用户提供的信息,例如导出的符号列表。
LLVM优化器收集控制流信息,数据流信息,并从优化器的角度更多地了解程序结构。我们的目标是在各个链接阶段共享这些信息,使链接器和优化器之间紧密集成。
第一阶段:读取LLVM bitcode文件
链接器首先读取所有的目标文件并收集符号信息,包括原生的目标文件以及LLVM的bitcode文件。为了在所有.o
文件都是原生目标文件的情况下降低链接器的开销,当提供的目标文件不是原生的目标文件时,链接器仅调用lto_module_create()
。如果lto_module_create()
返回指明该文件是LLVM 的bitcode文件,那么链接器使用lto_module_get_symbol_name()
和lto_module_get_symbol_attribute()
重新载入该模块,得到所有的符号信息。这些信息被添加到链接器的全局符号表中。
所有的lto*
函数都是在共享库libLTO
中实现的。它可以独立与链接器之外进行更新。它采用懒加载方式。
第二阶段:符号处理
在此阶段,链接器使用全局符号表对符号进行处理。可能会报符号未定义的错误,读取归档成员,替换弱符号等。链接器即使不知道LLVM bitcode文件的具体内容,也可以执行此操作。如果启用了死代码删除,那么链接器将收集活动符号列表。
第三阶段:优化bitcode文件
在符号解析后,链接器告诉LTO共享库哪些符号在原生的目标文件中是要用到的。在上面的例子中,链接器会通过函数lto_codegen_add_must_preserve_symbol()
向LTO共享库提供信息:只有foo1()
是原生目标文件将要用到的。接下来链接器使用函数lto_codegen_compile()
调用LLVM优化器和代码生成器,通过合并bitcode文件并应用各种优化pass来返回原生目标文件。
第四阶段:优化后的符号处理
此阶段,链接器读取优化后生成的原生目标文件并更新内部全局符号表响应所有的更改。对于LLVMbitcode文件使用到的外部符号的更改信息,链接器也会将其收集起来。在上面的例子中,由于foo3()
的移除,链接器注意到foo4()
不会再被调用,因此也会将foo4()
移除。更新全局符号表。
在这之后,链接器继续进行正常的链接操作,与bitcode文件的结合并不会影响到后续的链接。
libLTO
libLTO
作为LLVM工具的一部分,它是一个共享对象,旨在供链接器使用。libLTO
提供了一个抽象的C接口来使用LLVM过程优化器,并不会暴露LLVM内部的细节实现。
具体libLTO
的一些相关函数见这里