前言
- 官网地址 : LLVM
- LLVM项目是模块化,可重用的编译器以及工具链技术的集合
- 创始人,亦是Swift之父 Chris Lattner
编译器
- GCC
- LLVM
- Clang
编译器原理: 将代码首先进过编译器前端,目的是将代码规范化(词法分析,语法分析),检查错误等操作,
然后生成编译中间代码(LLVM IR),然后经过编译器后端不同架构生成对应的机器码(x86,PC,ARM不同处理器生成不同的机器码) -
LLVM架构展示:
Clang
- Clang 属于LLVM项目的一个子项目,基于LLVM架构的C/C++ / Objective-C 编译器前端
- Clang
- 相比GCC,有如下优点:
1.编译速度快 3倍
2.占用内存小 1/5左右
3.模块化设计 易于IDE集成
4.诊断信息可读性强 提示信息更加友善
OC源文件的编译过程
-
查看编译过程指令
clang -ccc-print-phases main.m
-
查看preprocessor(预处理)的结果,替换全局变量,词法/语法分析等
clang -E main.m
- 词法分析指令:(作用是每个单词会生成一个token)
clang -fmodules -E -Xclang -dump-tokens main.m
- 生成语法树
clang -fmodules -fsyntax-only -Xclang -ast-dump main.m
- 词法分析指令:(作用是每个单词会生成一个token)
-
生成中间代码
LLVM IR 有三种标识形式,但本质上是等价的,好比水可以是气态,液态,固态- text,便于阅读的文本格式,类似汇编语言,扩展名是.ll
clang -S -emit-llvm main.m
- 内存格式
- 二进制格式,扩展名.bc
clang -c -emit-llvm main.m
- IR的基本语法:
- text,便于阅读的文本格式,类似汇编语言,扩展名是.ll
1.注释是以;开头的
2.全局标识符以@开头,局部标识符以%开头
3.alloca,在当前函数栈帧中分配内存
4. i32, 32bit,4个字节的意思
5. align 内存对齐
6. store,写入数据
7. load 读取数据
未完待续....