这是我在《Unity游戏优化 (第2版)》看的,记录一下~
批处理的目的:
就是减少在当前视图中渲染所有对象所需的DrawCall数量
DrawCall是啥?
基本概念:
就是一个从CPU发送到GPU中用于绘制对象的请求
也就是为初始化当前渲染过程之前的配置选项
(Unity中也叫做 SetPassCall)
请求DrawCall之前需要准备什么呢?
1.网格和纹理数据必须从CPU内存(RAM)推送到GPU内存(VRAM)中(通常发生在场景初始化期间,或者是实例化场景物体完成时)CPU必须配置处理对象(也就是DrawCall的目标)所需要的选项和渲染特性,为GPU做准备
2.CPU和GPU进行通信(通过底层GraphicsAPI进行的,比如:DirectX、OpenGL、OpenGLES、Metal、WebGL或Vulkan),都调用通过一个称为 “驱动” 的类库来执行。这些API都倾向于以类似的方式运行,所以Unity可以通过一个公共接口支持很多不同的API
3.开始渲染之前,必须为准备渲染管线而配置大量的设置,称之为:渲染状态(Render State)。GPU将会为所有传入的对象保持相同的渲染状态,并以类似的方式渲染它们,直到渲染状态改变。
更改渲染状态是一个耗时的过程
a.如果将渲染状态设置为使用一个蓝色纹理文件,然后要求它选仍然一个巨大的网格,那么渲染会非常快,然后可以再渲染9个完全不同的网格,他们都显示为蓝色,因为没有改变所使用的纹理
b.如果想用10种不同的纹理渲染10个网格,就将花费更长的时间,因为在为每个网格发送DrawCall之前,需要使用新的纹理来准备渲染状态
用于渲染当前对象的纹理在Graphic API上是一个全局变量
如果想修改必须在修改渲染状态之前一直等待,直到当前所有的作业达到同一个同步点位置
如果一个作业很慢,最快的也需要等待,浪费了很多时间
eg:
可以触发渲染状态同步的操作有:
立即推送一张新纹理到GPU,修改着色器、照明信息、阴影、透明度和其他任何图形设置
- 4.决定了渲染状态后,CPU就必须决定绘制哪个网格,使用什么纹理和着色器,以及基于对象的位置、渲染和缩放(都表示在一个4x4的矩阵中,也就是Transform组件)决定在何处绘制对象,然后发送指令到GPU绘制它
CPU和GPU之间有一个 Command Buffer 的队列
新的指令会被推进这里,GPU每次执行完前面的命令就从中提取新的指令
批处理为啥能提升性能呢?
新的Draw Call不一定意味着必须配置新的渲染状态
如果两个对象完全共享相同的材质信息,那么GPU可以立即开始渲染新对象
消除了同步渲染状态浪费的时间,也减少了推入Command Buffer中的指令数,对CPU和GPU的工作负荷都有减少