Metal框架详细解析(二十六) —— 基本课程之参数缓冲 - 具有GPU编码的参数缓冲区(六)

版本记录

版本号 时间
V1.0 2018.10.09 星期二

前言

很多做视频和图像的,相信对这个框架都不是很陌生,它渲染高级3D图形,并使用GPU执行数据并行计算。接下来的几篇我们就详细的解析这个框架。感兴趣的看下面几篇文章。
1. Metal框架详细解析(一)—— 基本概览
2. Metal框架详细解析(二) —— 器件和命令(一)
3. Metal框架详细解析(三) —— 渲染简单的2D三角形(一)
4. Metal框架详细解析(四) —— 关于GPU Family 4(一)
5. Metal框架详细解析(五) —— 关于GPU Family 4之关于Imageblocks(二)
6. Metal框架详细解析(六) —— 关于GPU Family 4之关于Tile Shading(三)
7. Metal框架详细解析(七) —— 关于GPU Family 4之关于光栅顺序组(四)
8. Metal框架详细解析(八) —— 关于GPU Family 4之关于增强的MSAA和Imageblock采样覆盖控制(五)
9. Metal框架详细解析(九) —— 关于GPU Family 4之关于线程组共享(六)
10. Metal框架详细解析(十) —— 基本组件(一)
11. Metal框架详细解析(十一) —— 基本组件之器件选择 - 图形渲染的器件选择(二)
12. Metal框架详细解析(十二) —— 基本组件之器件选择 - 计算处理的设备选择(三)
13. Metal框架详细解析(十三) —— 计算处理(一)
14. Metal框架详细解析(十四) —— 计算处理之你好,计算(二)
15. Metal框架详细解析(十五) —— 计算处理之关于线程和线程组(三)
16. Metal框架详细解析(十六) —— 计算处理之计算线程组和网格大小(四)
17. Metal框架详细解析(十七) —— 工具、分析和调试(一)
18. Metal框架详细解析(十八) —— 工具、分析和调试之Metal GPU Capture(二)
19. Metal框架详细解析(十九) —— 工具、分析和调试之GPU活动监视器(三)
20. Metal框架详细解析(二十) —— 工具、分析和调试之关于Metal着色语言文件名扩展名、使用Metal的命令行工具构建库和标记Metal对象和命令(四)
21. Metal框架详细解析(二十一) —— 基本课程之基本缓冲区(一)
22. Metal框架详细解析(二十二) —— 基本课程之基本纹理(二)
23. Metal框架详细解析(二十三) —— 基本课程之CPU和GPU同步(三)
24. Metal框架详细解析(二十四) —— 基本课程之参数缓冲 - 基本参数缓冲(四)
25. Metal框架详细解析(二十五) —— 基本课程之参数缓冲 - 带有数组和资源堆的参数缓冲区(五)

Argument Buffers with GPU Encoding - 具有GPU编码的参数缓冲区

演示如何使用计算传递对参数缓冲区进行编码,然后在后续渲染过程中访问其参数。

Argument Buffers with Arrays and Resource Heaps示例中,您学习了如何将参数缓冲区与资源和资源堆组合在一起。

在本示例中,您将学习如何使用图形或计算函数将资源编码为参数缓冲区。 特别是,您将学习如何从计算传递中将数据写入参数缓冲区,然后在渲染过程中读取该数据。 该示例呈现多个四元实例的网格,每个实例应用两个纹理,其中纹理在四边形内从左向右滑动,在四边形之间从左向右移动。


Encode Data into Argument Buffers - 将数据编码到参数缓冲区中

在初始化期间,样本使用CPU将数据编码到由SourceTextureArguments结构定义的参数缓冲区中。

typedef struct SourceTextureArguments {
    array<texture2d<float>, AAPLNumTextures> textures [[ id(AAPLArgumentBufferIDTextures) ]];
} SourceTextureArguments;

此参数缓冲区由_sourceTextures缓冲区支持,可通过updateInstances函数中的source_textures变量进行访问。source_textures包含由样本渲染器加载的纹理的引用数组。

在初始化之后,对于每个帧,样本使用GPU将数据编码到由InstanceArguments结构定义的单独的参数缓冲区中。

typedef struct InstanceArguments {
    vector_float2    position;
    texture2d<float> left_texture;
    texture2d<float> right_texture;
} InstanceArguments;

此参数缓冲区由_instanceParameters缓冲区支持,可通过updateInstancesvertexShaderfragmentShader函数中的instance_params变量进行访问。 instance_params是一个结构数组,其数据在计算传递中填充,然后通过实例化绘制调用在渲染过程中访问。


Create an Array of Argument Buffer Structures - 创建一个参数缓冲区结构数组

该示例定义了一个InstanceArguments结构,其中包含计算函数updateInstances,对矢量和两个纹理进行编码。

typedef struct InstanceArguments {
    vector_float2    position;
    texture2d<float> left_texture;
    texture2d<float> right_texture;
} InstanceArguments;

前一个参数缓冲区样本使用encodedLength属性直接确定支持参数缓冲区结构的MTLBuffer所需的大小。 但是,此示例需要为后续渲染过程渲染的每个四边形提供此结构的一个实例。 因此,该示例将encodedLength的值乘以实例总数,该实例总数由AAPLNumInstances常量的值定义。

NSUInteger instanceParameterLength = instanceParameterEncoder.encodedLength * AAPLNumInstances;

_instanceParameters = [_device newBufferWithLength:instanceParameterLength options:0];

注意:[[id(n)]]属性限定符不是在此示例中定义InstanceArguments结构所必需的。 仅当通过Metal API使用CPU对参数进行编码时才需要此限定符,而不是在通过图形或计算函数使用GPU对参数进行编码时。


Encode an Argument Buffer with a Compute Function - 使用计算函数对参数缓冲区进行编码

对于要渲染的每个四边形,样本执行updateInstances计算函数以确定四边形的位置和纹理。 样本执行的计算过程遍历instance_params数组,并为每个四元组编码正确的数据。 该示例通过在instanceID索引值处设置数组元素中的InstanceArguments值,将数据编码为instance_params

device  InstanceArguments & quad_params = instance_params[instanceID];

// Store the position of the quad
quad_params.position = position;

// Select and store the textures to apply to this quad
quad_params.left_texture = source_textures.textures[left_texture_index];
quad_params.right_texture = source_textures.textures[right_texture_index];

Render Instances with an Argument Buffer - 使用参数缓冲区渲染实例

该示例发出实例化绘制调用以呈现四边形,同时产生最小量的CPU开销。 将此技术与参数缓冲区相结合,允许样本在同一个绘制调用中为每个四元组使用一组唯一的资源,其中每个实例绘制一个四元组。

该示例在顶点和片段函数的签名中声明了一个instanceID变量。 渲染管道使用instanceID索引到以前由updateInstances计算函数编码的instance_params数组。

在顶点函数中,instanceID被定义为具有[[instance_id]]属性限定符的参数。

vertex RasterizerData
vertexShader(uint                      vertexID        [[ vertex_id ]],
             uint                      instanceID      [[ instance_id ]],
             device AAPLVertex        *vertices        [[ buffer(AAPLVertexBufferIndexVertices) ]],
             device InstanceArguments *instance_params [[ buffer(AAPLVertexBufferIndexInstanceParams) ]],
             constant AAPLFrameState  &frame_state     [[ buffer(AAPLVertexBufferIndexFrameState) ]])

顶点函数从参数缓冲区中读取位置数据,以在drawable中的正确位置渲染四边形。

float2 quad_position = instance_params[instanceID].position;

顶点函数然后通过RasterizerData结构和[[stage_in]]属性限定符将instanceID变量传递给fragment函数。 (在fragment函数中,通过in参数访问instanceID。)

fragment float4
fragmentShader(RasterizerData            in              [[ stage_in ]],
               device InstanceArguments *instance_params [[ buffer(AAPLFragmentBufferIndexInstanceParams) ]],
               constant AAPLFrameState  &frame_state     [[ buffer(AAPLFragmentBufferIndexFrameState) ]])

片段函数从参数缓冲区中指定的两个纹理中进行采样,然后根据slideFactor的值选择输出样本。

texture2d<float> left_texture = instance_params[instanceID].left_texture;
texture2d<float> right_texture = instance_params[instanceID].right_texture;

float4 left_sample = left_texture.sample(texture_sampler, in.tex_coord);
float4 right_sample = right_texture.sample(texture_sampler, in.tex_coord);

if(frame_state.slideFactor < in.tex_coord.x)
{
    output_color = left_sample;
}
else
{
    output_color = right_sample;
}

片段函数输出所选样本。 左侧纹理从左侧滑入,右侧纹理向右滑动。 在右纹理完全滑离四边形之后,样本将此纹理指定为下一个计算过程中的左纹理。 因此,每个纹理在四边形网格上从左向右移动。

在此示例中,您学习了如何使用图形或计算函数将资源编码为参数缓冲区

后记

本篇主要讲述了具有GPU编码的参数缓冲区,感兴趣的给个赞或者关注~~~

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容