版本记录
版本号 | 时间 |
---|---|
V1.0 | 2018.10.10 星期三 |
前言
很多做视频和图像的,相信对这个框架都不是很陌生,它渲染高级3D图形,并使用GPU执行数据并行计算。接下来的几篇我们就详细的解析这个框架。感兴趣的看下面几篇文章。
1. Metal框架详细解析(一)—— 基本概览
2. Metal框架详细解析(二) —— 器件和命令(一)
3. Metal框架详细解析(三) —— 渲染简单的2D三角形(一)
4. Metal框架详细解析(四) —— 关于GPU Family 4(一)
5. Metal框架详细解析(五) —— 关于GPU Family 4之关于Imageblocks(二)
6. Metal框架详细解析(六) —— 关于GPU Family 4之关于Tile Shading(三)
7. Metal框架详细解析(七) —— 关于GPU Family 4之关于光栅顺序组(四)
8. Metal框架详细解析(八) —— 关于GPU Family 4之关于增强的MSAA和Imageblock采样覆盖控制(五)
9. Metal框架详细解析(九) —— 关于GPU Family 4之关于线程组共享(六)
10. Metal框架详细解析(十) —— 基本组件(一)
11. Metal框架详细解析(十一) —— 基本组件之器件选择 - 图形渲染的器件选择(二)
12. Metal框架详细解析(十二) —— 基本组件之器件选择 - 计算处理的设备选择(三)
13. Metal框架详细解析(十三) —— 计算处理(一)
14. Metal框架详细解析(十四) —— 计算处理之你好,计算(二)
15. Metal框架详细解析(十五) —— 计算处理之关于线程和线程组(三)
16. Metal框架详细解析(十六) —— 计算处理之计算线程组和网格大小(四)
17. Metal框架详细解析(十七) —— 工具、分析和调试(一)
18. Metal框架详细解析(十八) —— 工具、分析和调试之Metal GPU Capture(二)
19. Metal框架详细解析(十九) —— 工具、分析和调试之GPU活动监视器(三)
20. Metal框架详细解析(二十) —— 工具、分析和调试之关于Metal着色语言文件名扩展名、使用Metal的命令行工具构建库和标记Metal对象和命令(四)
21. Metal框架详细解析(二十一) —— 基本课程之基本缓冲区(一)
22. Metal框架详细解析(二十二) —— 基本课程之基本纹理(二)
23. Metal框架详细解析(二十三) —— 基本课程之CPU和GPU同步(三)
24. Metal框架详细解析(二十四) —— 基本课程之参数缓冲 - 基本参数缓冲(四)
25. Metal框架详细解析(二十五) —— 基本课程之参数缓冲 - 带有数组和资源堆的参数缓冲区(五)
26. Metal框架详细解析(二十六) —— 基本课程之参数缓冲 - 具有GPU编码的参数缓冲区(六)
Advanced Techniques - 高级技术
通过有效使用Metal功能,了解如何实现高级技术。
以下示例代码项目演示了各种图形和计算技术,这些技术经过专门优化以利用Metal功能。
-
Reflections with Layer Selection
- 演示如何使用图层选择来减少反射对象所需的渲染过程的数量。
-
LOD with Function Specialization
- 演示如何使用专用函数根据动态条件选择细节级别。
-
Dynamic Terrain with Argument Buffers
- 演示如何使用参数缓冲区通过GPU驱动的管道实时渲染动态地形。
-
- 了解如何使用多个设备。
Reflections with Layer Selection - 图层选择的反射
演示如何使用图层选择来减少反射对象所需的渲染过程的数量。
此示例演示了铬球上的动态反射,使用图层选择以两次渲染帧。 第一遍将环境渲染到立方体贴图上。 第二遍将环境反射渲染到球体上;它渲染场景中的其他actors
;它呈现环境本身。
您可以通过从环境的立方体贴图中对其反射进行采样来实现反映其环境的对象。 立方体贴图是由以立方体形状排列的六个2D纹理层组成的单个纹理。 反射根据环境中其他对象的位置而变化,因此每个立方体贴图的六个面必须在每个帧中动态渲染。 这通常需要六个单独的渲染过程,每个面一个,但Metal允许您在一次过程中渲染整个立方体贴图。
Separate the Scene - 分离场景
立方体贴图表示为具有六个图层的渲染目标数组,每个图层对应一个面。 为顶点函数返回值的结构成员指定的[[render_target_array_index]]
属性限定符分别标识每个数组层。 此图层选择功能允许样本决定将环境的哪个部分渲染到哪个立方体贴图面。
AAPLActorData
对象表示场景中的actor
。 在此示例中,每个actor都是具有相同网格数据但具有不同漫反射颜色的模型。 这些actor坐在XZ平面上;它们总是相对于球体在X或Z方向上反射,并且可以渲染到立方体贴图的任何+ X,-X,+ Z或-Z面。
Perform Culling Tests for the Reflection Pass - 执行反射通过的剔除测试
在渲染到立方体贴图之前,了解应该渲染每个actor的面是很有用的。 确定此信息涉及称为剔除测试的过程,并且针对每个立方体贴图面对每个actor执行该过程。
在每个帧的开始处,对于每个立方体贴图面,计算视图矩阵并且视图的截锥体存储在culler_probe
数组中。
// 1) Get the view matrix for the face given the sphere's updated position
viewMatrix[i] = _cameraReflection.GetViewMatrixForFace_LH (i);
// 2) Calculate the planes bounding the frustum using the updated view matrix
// You use these planes later to test whether an actor's bounding sphere
// intersects with the frustum, and is therefore visible in this face's viewport
culler_probe[i].Reset_LH (viewMatrix [i], _cameraReflection);
这些culler probes
测试actor
和每个立方体贴图面的视锥体之间的交叉点。 测试结果确定actor在反射过程中渲染到多少个面(instanceCount)
,以及它渲染到哪个面(instanceParams)
。
if (_actorData[actorIdx].passFlags & EPassFlags::Reflection)
{
int instanceCount = 0;
for (int faceIdx = 0; faceIdx < 6; faceIdx++)
{
// Check if the actor is visible in the current probe face
if (culler_probe [faceIdx].Intersects (_actorData[actorIdx].modelPosition.xyz, _actorData[actorIdx].bSphere))
{
// Add this face index to the the list of faces for this actor
InstanceParams instanceParams = {(ushort)faceIdx};
instanceParams_reflection [MaxVisibleFaces * actorIdx + instanceCount].viewportIndex = instanceParams.viewportIndex;
instanceCount++;
}
}
_actorData[actorIdx].instanceCountInReflection = instanceCount;
}
下图显示了根据它们相对于反射球的位置对actors
进行的剔除测试的结果。 因为_actorData [0]
和actorData [1]
将两个视锥体平分,所以它们的instanceCount
属性设置为2,并且它们的instanceParams
数组中有两个元素。 (此数组包含actors
相交的视锥体的立方体贴图面索引。)
Configure Render Targets for the Reflection Pass - 配置Reflection Pass的渲染目标
反射过程的渲染目标是立方体贴图。 该示例通过使用具有颜色渲染目标,深度渲染目标和六个图层的MTLRenderPassDescriptor
对象来配置渲染目标。 renderTargetArrayLength
属性设置立方体贴图面的数量,并允许渲染管道渲染到其中的任何一个或全部。
reflectionPassDesc.colorAttachments[0].texture = _reflectionCubeMap;
reflectionPassDesc.depthAttachment.texture = _reflectionCubeMapDepth;
reflectionPassDesc.renderTargetArrayLength = 6;
Issue Draw Calls for the Reflection Pass - 发出反射过程的绘制调用
drawActors:pass:
方法为每个actor
设置图形渲染状态。 只有在六个立方体贴图面中的任何一个中可见时,才会绘制Actor,由visibleVpCount
值(通过instanceCountInReflection
属性访问)确定。 visibleVpCount
的值确定实例化绘制调用的实例数。
[renderEncoder drawIndexedPrimitives: metalKitSubmesh.primitiveType
indexCount: metalKitSubmesh.indexCount
indexType: metalKitSubmesh.indexType
indexBuffer: metalKitSubmesh.indexBuffer.buffer
indexBufferOffset: metalKitSubmesh.indexBuffer.offset
instanceCount: visibleVpCount
baseVertex: 0
baseInstance: actorIdx * MaxVisibleFaces];
在此绘制调用中,示例将baseInstance
参数设置为actorIdx * 5
的值。此设置很重要,因为它告诉顶点函数如何为每个实例选择适当的渲染目标图层。
Render the Reflection Pass - 渲染反射Pass
在vertexTransform
顶点函数中,instanceParams
参数指向包含每个actor应渲染到的立方体贴图面的缓冲区。 instanceId
值索引到instanceParams
数组中。
vertex ColorInOut vertexTransform ( Vertex in [[ stage_in ]],
uint instanceId [[ instance_id ]],
device InstanceParams* instanceParams [[ buffer (BufferIndexInstanceParams) ]],
device ActorParams& actorParams [[ buffer (BufferIndexActorParams) ]],
constant ViewportParams* viewportParams [[ buffer (BufferIndexViewportParams) ]] )
顶点函数ColorInOut
的输出结构包含使用[[render_target_array_index]]
属性限定符的face
成员。 face的返回值确定渲染管道应渲染到的立方体贴图面。
typedef struct
{
float4 position [[position]];
float2 texCoord;
half3 worldPos;
half3 tangent;
half3 bitangent;
half3 normal;
uint face [[render_target_array_index]];
} ColorInOut;
因为draw
调用的baseInstance
参数的值设置为actorIdx * 5
,所以在draw调用中绘制的第一个实例的instanceId
值等于此值。 实例的每个后续呈现都将instanceId
值递增1。instanceParams
数组为每个actor提供五个槽,因为actor最多可以在五个立方体贴图面中可见。 因此,instanceParams [instanceId]
元素始终包含actor中可见的面部索引之一。 因此,该示例使用此值来选择有效的渲染目标图层。
out.face = instanceParams[instanceId].viewportIndex;
总之,为了将每个actor渲染到反射立方体贴图,该示例为actor发出一个实例化绘制调用。 顶点函数使用内置的instanceId
变量来索引instanceParams
数组,该数组包含应该渲染实例的立方体贴图面的索引。 因此,顶点函数在面返回值成员中设置此面的索引,该成员使用[[render_target_array_index]]
属性限定符。 这可确保每个actor都呈现给它应该出现的每个立方体贴图面。
Perform Culling Tests for the Final Pass - 执行最终过程的剔除测试
该示例在最后过程中对主摄像机执行类似的视图更新。 在每个帧的开始处,计算视图矩阵,并且视图的平截头体存储在culler_final
变量中。
_cameraFinal.target = SceneCenter;
_cameraFinal.rotation = fmod ((_cameraFinal.rotation + CameraRotationSpeed), M_PI*2.f);
matrix_float3x3 rotationMatrix = matrix3x3_rotation (_cameraFinal.rotation, CameraRotationAxis);
_cameraFinal.position = SceneCenter;
_cameraFinal.position += matrix_multiply (rotationMatrix, CameraDistanceFromCenter);
const matrix_float4x4 viewMatrix = _cameraFinal.GetViewMatrix();
const matrix_float4x4 projectionMatrix = _cameraFinal.GetProjectionMatrix_LH();
culler_final.Reset_LH (viewMatrix, _cameraFinal);
ViewportParams *viewportBuffer = (ViewportParams *)_viewportsParamsBuffers_final[_uniformBufferIndex].contents;
viewportBuffer[0].cameraPos = _cameraFinal.position;
viewportBuffer[0].viewProjectionMatrix = matrix_multiply (projectionMatrix, viewMatrix);
这个最终的culler probe
用于测试actor和摄像机的视锥体之间的交叉点。 测试结果仅确定每个actor在最后一遍中是否可见。
if (culler_final.Intersects (_actorData[actorIdx].modelPosition.xyz, _actorData[actorIdx].bSphere))
{
_actorData[actorIdx].visibleInFinal = YES;
}
else
{
_actorData[actorIdx].visibleInFinal = NO;
}
Configure Render Targets for the Final Pass - 配置最终过程的渲染目标
最终过程的渲染目标是视图的drawable
,它是通过访问视图的currentRenderPassDescriptor
属性获得的可显示资源。 但是,您不能过早访问此属性,因为它隐式检索drawable
。Drawable
是由Core Animation
框架创建和维护的昂贵系统资源。 你应该尽可能短暂地持有一个drawable
,以避免资源停滞。 在此示例中,在编码最终渲染过程之前获取drawable
。
MTLRenderPassDescriptor* finalPassDescriptor = view.currentRenderPassDescriptor;
finalPassDescriptor.renderTargetArrayLength = 1;
id<MTLRenderCommandEncoder> renderEncoder =
[commandBuffer renderCommandEncoderWithDescriptor:finalPassDescriptor];
renderEncoder.label = @"FinalPass";
[self drawActors: renderEncoder pass: EPassFlags::Final];
[renderEncoder endEncoding];
Issue Draw Calls for the Final Pass - 发出最终过程的绘制调用
drawActors:pass:
方法为每个actor
设置图形渲染状态。 只有在主摄像机可见的情况下才会绘制Actor,由visibleVpCount
值(通过visibleInFinal
属性访问)确定。
因为每个actor
在最后一次传递中只绘制一次,所以instanceCount
参数始终设置为1,baseInstance
参数始终设置为0。
Render the Final Pass - 渲染最终过程
最后过程将最终帧直接渲染到视图的drawable
,然后在屏幕上显示。
[commandBuffer presentDrawable:view.currentDrawable];
后记
本篇主要讲述了图层选择的反射,感兴趣的给个赞或者关注~~~