1、IL2CPP组成:
(1)AOT编译器(il2cpp.exe)
unity中IL2CPP编译步骤如下:
a、将 Unity Scripting API 代码编译为常规 .NET DLL(托管程序集)。
b、应用托管字节码剥离。此步骤可显著减小构建的游戏大小。
c、将所有托管程序集转换为标准 C++ 代码。
d、使用本机平台编译器编译生成的 C++ 代码和 IL2CPP 的运行时部分。
e、将代码链接到可执行文件或 DLL,具体取决于目标平台。
(2)运行时库(libil2cpp)
il2cpp头文件和源码位置:
Unity安装目录下:Unity\Editor\Data\il2cpp\libil2cpp
2、IL2CPP特点:
(1)针对C#中计算密集型代码性能相比Mono提高很多
(2)只支持AOT编译
(3)相对于Mono,构建时间更长,生成代码量更大
3、IL2CPP生成的C++代码解析(Unity版本:2019.4.23)
(1)成员变量
由上图可以看出,il2cpp将成员变量的生成分为两个结构体,一个结构体包含所有普通成员变量,另一个包StaticFields包含所有的静态成员变量。每一个成员变量都会生成一个get和一个set的内联函数。
因为静态成员是所有实例共享的数据,因此在运行的时候,Varient_t75DD1618D504050BE978835922A46B83C2969565_StaticFields只有一份。所有的Varient_t75DD1618D504050BE978835922A46B83C2969565实例都共享这个数据。调用时如上图所示,在Varient_t75DD1618D504050BE978835922A46B83C2969565的元信息结构中有一个指向Varient_t75DD1618D504050BE978835922A46B83C2969565_StaticFields结构的指针,获取staticfield指针再调用对应的get方法。
(2)普通成员函数:
(3)静态方法
如上面几个图所示,所有的函数都被声明成了IL2CPP_EXTERN_C也就是extern “C”类型,这样一来,在需要的时候就可以骗过C++编译器让其认为所有这些函数都是一个类型。
所有的函数都不是成员函数。函数的第一个参数永远都是“this”指针。对于托管代码中的静态函数,IL2CPP会忽略这个参数也就相当于传递NULL作为第一个参数的值。这么做的好处是可以让il2cpp.exe转换代码的逻辑更加简单并且让代理函数的处理变得更加容易。所有的函数还有一个额外的RuntimeMethod*参数用来描述函数的元信息。这些元信息是虚函数调用的关键。Mono使用和特定平台相关的方法来传递这些元信息。而IL2CPP出于可移植方面的考虑,并没有使用这些和平台相关的特定代码。在this指针和RuntimeMethod*之间的就是函数实际用到的参数。
托管代码中的类型会被加上“_t”的后缀,函数则是加上“_m”后缀和一个唯一的MD5码来避免名字的重复。
(4)异常处理
托管代码中的异常都会被il2cpp转换成C++的异常。如图3-11,所有托管异常都被封装在C++中的IL2CppExcetionWrapper类型,当C++代码捕获异常后,会解析获取对应的托管异常,通过il2cpp_codegen_class_is_assignable_from()判断该异常是否要捕获的异常,如果是则跳转至Catch代码块执行,否则抛出一个C++异常。
(5)goto
如图3-11所示,我们发现生成的C++代码中包含goto语句。这是因为IL中没有while、do和for循环以及if/else结构,它们都是使用标签、相等goto与条件goto语句实现的。所以il2cpp在处理IL代码时,也直接使用标签+goto的方式实现。
(6)il2cpp.exe不针对每一个类中的函数生成单独的一个cpp文件,而是将很多类的函数放在一个.cpp文件。如上图,Assetbly-CSharp中所有的函数被生成在5个.cpp文件中。il2cpp之所以这么做的原因是C++编译器在编译相同代码量的情况下,处理大量的文件的用时比集中处理少量文件长很多。
(7)泛型共享
il2cpp针对泛型参数是引用类型还是值类型生成不同的共享代码。
对于引用类型的泛型共享,由于所有托管代码中的引用类型都继承自System.Object,转成C++代码后都能用RuntimeObject *指针表示。所以所有引用类型都可以共享一份代码实现。
而对于值类型,泛型T的大小不同,只能针对不同的值类型生成特有的代码。
如图3-14,当泛型类型是string和AnyClass两个引用类型,最终调用的构造函数是同一个函数即GenericType_1__ctor_mAF3DF5964EBFD3F6A60BB493C66276FA1FCF431B_gshared。
而当泛型参数是DateTime和Int两个值类型时,针对各自类型生成了特有的构造函数:
GenericType_1__ctor_mBD3620561730BBF48F1E983A56B62AD1A7487645_gshared和GenericType_1__ctor_mC02B2327528BC3724FACBF36E3CA75FA335AC1B7_gshared。
另外il2cpp总是先生成全共享代码(参数是引用类型的泛型类)。其它参数是值类型的泛型代码是在托管代码中有用到时才会生成特有类型的代码,从而减少代码体量。
另外泛型类中的函数也是和泛型类性绑定的,不论函数是否使用泛型类型参数。如图3-13中的UseGenericParameter()和DoesNotUseGenericParameter()都生成了类型特有的方法。如图3-15所示。
(8)P/Invloke封装
P/Invoke就是托管代码调用封装在DLL中的非托管函数。虽然IL2CPP会将托管代码转换为C++代码,但IL2CPP针对C#中数据类型生成的C++数据类型和原生的C++类型会存在区别,所有IL2CPP运行时就需要进行类型转换操作。
托管代码中,数据类型可以分为两类:blittable和non-blittable。blittable类型数据在托管和原生代码中内存表示一致,如:byte、int、float等;
而non-blittable类型数据在托管代码中和C++原生代码中内存表现不同,如:bool、string、array等。而进行类型转换就会引发分配新的内存。
a、内存转换non-blittable类型
如图3-16所示是生成的C++代码,其中string类型参数被转换成char*,产生了新的内存分配,并且在函数执行结束后,调用il2cpp_codegen_marshal_free释放char*内存。所以non-blittable类型内存转换相对于blittable类型的转换是个耗时又要有新内存开销的操作。
b、内存转换数组
如果转换的是一个元素为blittable类型的数组,只是调用il2cpp_codegen_marshal_array()返回托管代码中数组的首地址。如图3-19。
如果转换元素为non-bilttable类型的数组,则需要调用il2cpp_codegen_marshal_allocate_array()分配一个新的数组,并且对数组中每个元素做一次内存转换。如图3-21。
4、使用IL2CPP代码优化:
(1)Devirtualization
通过对IL2CPP生成的C++代码分析,当调用一个抽象方法时,il2cpp生成的C++代码都会执行一次虚方法调用(VirtFuncInvoker),虚方法调用就会查询虚函数表vtable找到合适的方法进行调用,所以虚方法调用比直接函数调用开销大。
所以我们应尽量避免虚方法调用,明确直接方法调用。另外,能明确不需要子类继承的类或方法使用sealed关键字标记,这样il2cpp生成C++代码时可以明确的知道使用哪个方法,就可以直接调用对应的方法取代虚方法调用。
以上内容翻译自Unity Blog中来自Josh Peterson的博客(https://blog.unity.com/author/cap-josh)以及Unity官方手册。