Code Generation Options
在
Xcode Build Setting
中的设置:设置
Optimization Level
(编译器的优化程度),它会在编译时生成目标文件时进行优化
None [-O0]
:不优化。
在这种设置下, 编译器的目标是降低编译消耗,保证调试时输出期望的结果。程序的语句之间是独立的:如果在程序的停在某一行的断点出,我们可以给任何变量赋新值抑或是将程序计数器指向方法中的任何一个语句,并且能得到一个和源码完全一致的运行结果。
Fast [-O1]
:大函数所需的编译时间和内存消耗都会稍微增加。
在这种设置下,编译器会尝试减小代码文件的大小,减少执行时间,但并不执行需要大量编译时间的优化。在苹果的编译器中,在优化过程中,严格别名,块重排和块间的调度都会被默认禁止掉。此优化级别提供了良好的调试体验,堆栈使用率也提高,并且代码质量优于None [-O0]
。
Faster [-O2]
:编译器执行所有不涉及时间空间交换的所有的支持的优化选项。
是更高的性能优化Fast [-O1]
。在这种设置下,编译器不会进行循环展开、函数内联或寄存器重命名。和Fast [-O1]
项相比,此设置会增加编译时间,降低调试体验,并可能导致代码大小增加,但是会提高生成代码的性能。
Fastest [-O3]
:在开启Fast [-O1]
项支持的所有优化项的同时,开启函数内联和寄存器重命名选项。
是更高的性能优化Faster [-O2]
,指示编译器优化所生成代码的性能,而忽略所生成代码的大小,有可能会导致二进制文件变大。还会降低调试体验。
Fastest, Smallest [-Os]
:在不显着增加代码大小的情况下尽量提供高性能。
这个设置开启了Fast [-O1]
项中的所有不增加代码大小的优化选项,并会进一步的执行可以减小代码大小的优化。增加的代码大小小于Fastest [-O3]
。与Fast [-O1]
相比,它还会降低调试体验。
Fastest, Aggressive Optimizations [-Ofast]
:与Fastest, Smallest [-Os]
相比该级别还执行其他更激进的优化。
这个设置开启了Fastest [-O3]
中的所有优化选项,同时也开启了可能会打破严格编译标准的积极优化,但并不会影响运行良好的代码。该级别会降低调试体验,并可能导致代码大小增加。
Smallest, Aggressive Size Optimizations [-Oz]
:不使用LTO
的情况下减小代码大小。
与-Os
相似,指示编译器仅针对代码大小进行优化,而忽略性能优化,这可能会导致代码变慢。
案例1:
将优化程度设置为
Fastest, Smallest [-Os]
,汇编代码会发生怎样的变化?打开
ViewController.m
文件,写入以下代码:#import "ViewController.h" int sum(int a,int b){ return a + b; } @implementation ViewController - (void)viewDidLoad { // [super viewDidLoad]; int a = 1; int b = 2; int c = sum(a, b); printf("c"); } @end
Debug
模式,Optimization Level
默认为None [-O0]
(不优化)。真机运行项目,来到viewDidLoad
方法
- 在编译器不优化的情况下,生成的汇编代码分为四段
- 先将局部变量
1
和2
写入w8
,然后将w8
入栈保护- 读取栈中局部变量放入值,写入
w0
、w1
,调用sum
函数- 将
sum
函数返回的结果w0
入栈保护- 内存分页寻址,计算出常量区
c
的地址,调用printf
函数将
Optimization Level
设置为Fastest, Smallest [-Os]
真机运行项目,来到
viewDidLoad
方法
- 同样的代码,修改优化程度后,汇编代码发生天翻地覆的变化
- 局部变量
a
和b
,sum
函数的调用,以及函数的返回结果,全部被优化掉。因为这些代码的调用,不会影响执行结果- 对于之前常量区的
c
,也不再计算地址,直接将#0x63
写入w0
案例2:
将
sum
函数的返回值进行打印,汇编代码会怎样优化?打开
ViewController.m
文件,写入以下代码:@implementation ViewController - (void)viewDidLoad { // [super viewDidLoad]; int a = 1; int b = 2; int c = sum(a, b); printf("%d",c); } @end
真机运行项目,来到
viewDidLoad
方法
- 局部变量
a
和b
,sum
函数的调用,以及函数的返回结果,全部被优化掉- 预先计算出结果,直接将
#0x3
写入w8
总结
Code Generation Options
- 对
Optimization Level
配置项,提供不同程度的优化选择None [-O0]
:不优化Fast [-O1]
:大函数所需的编译时间和内存消耗都会稍微增加Faster [-O2]
:编译器执行所有不涉及时间空间交换的所有的支持的优化选项Fastest [-O3]
:在开启Fast [-O1]
项支持的所有优化项的同时,开启函数内联和寄存器重命名选项Fastest, Smallest [-Os]
:在不显着增加代码大小的情况下尽量提供高性能Fastest, Aggressive Optimizations [-Ofast]
:与Fastest, Smallest [-Os]
相比该级别还执行其他更激进的优化Smallest, Aggressive Size Optimizations [-Oz]
:不使用LTO
的情况下减小代码大小- 发布
Release
版本时,使用Fastest, Smallest [-Os]
级别更为适宜。最后两个级别过于激进,更快的代价可能会牺牲更多空间,故此不建议使用编译器优化
- 编译器优化是
LLVM Pass
的优化过程,优化指令的多少- 无用代码会被优化掉,即:去掉后对执行结果没有影响的代码