版本记录
版本号 | 时间 |
---|---|
V1.0 | 2018.10.09 星期二 |
前言
很多做视频和图像的,相信对这个框架都不是很陌生,它渲染高级3D图形,并使用GPU执行数据并行计算。接下来的几篇我们就详细的解析这个框架。感兴趣的看下面几篇文章。
1. Metal框架详细解析(一)—— 基本概览
2. Metal框架详细解析(二) —— 器件和命令(一)
3. Metal框架详细解析(三) —— 渲染简单的2D三角形(一)
4. Metal框架详细解析(四) —— 关于GPU Family 4(一)
5. Metal框架详细解析(五) —— 关于GPU Family 4之关于Imageblocks(二)
6. Metal框架详细解析(六) —— 关于GPU Family 4之关于Tile Shading(三)
7. Metal框架详细解析(七) —— 关于GPU Family 4之关于光栅顺序组(四)
8. Metal框架详细解析(八) —— 关于GPU Family 4之关于增强的MSAA和Imageblock采样覆盖控制(五)
9. Metal框架详细解析(九) —— 关于GPU Family 4之关于线程组共享(六)
10. Metal框架详细解析(十) —— 基本组件(一)
11. Metal框架详细解析(十一) —— 基本组件之器件选择 - 图形渲染的器件选择(二)
12. Metal框架详细解析(十二) —— 基本组件之器件选择 - 计算处理的设备选择(三)
13. Metal框架详细解析(十三) —— 计算处理(一)
14. Metal框架详细解析(十四) —— 计算处理之你好,计算(二)
15. Metal框架详细解析(十五) —— 计算处理之关于线程和线程组(三)
16. Metal框架详细解析(十六) —— 计算处理之计算线程组和网格大小(四)
17. Metal框架详细解析(十七) —— 工具、分析和调试(一)
18. Metal框架详细解析(十八) —— 工具、分析和调试之Metal GPU Capture(二)
19. Metal框架详细解析(十九) —— 工具、分析和调试之GPU活动监视器(三)
20. Metal框架详细解析(二十) —— 工具、分析和调试之关于Metal着色语言文件名扩展名、使用Metal的命令行工具构建库和标记Metal对象和命令(四)
21. Metal框架详细解析(二十一) —— 基本课程之基本缓冲区(一)
22. Metal框架详细解析(二十二) —— 基本课程之基本纹理(二)
23. Metal框架详细解析(二十三) —— 基本课程之CPU和GPU同步(三)
24. Metal框架详细解析(二十四) —— 基本课程之参数缓冲 - 基本参数缓冲(四)
25. Metal框架详细解析(二十五) —— 基本课程之参数缓冲 - 带有数组和资源堆的参数缓冲区(五)
Argument Buffers with GPU Encoding - 具有GPU编码的参数缓冲区
演示如何使用计算传递对参数缓冲区进行编码,然后在后续渲染过程中访问其参数。
在Argument Buffers with Arrays and Resource Heaps示例中,您学习了如何将参数缓冲区与资源和资源堆组合在一起。
在本示例中,您将学习如何使用图形或计算函数将资源编码为参数缓冲区。 特别是,您将学习如何从计算传递中将数据写入参数缓冲区,然后在渲染过程中读取该数据。 该示例呈现多个四元实例的网格,每个实例应用两个纹理,其中纹理在四边形内从左向右滑动,在四边形之间从左向右移动。
Encode Data into Argument Buffers - 将数据编码到参数缓冲区中
在初始化期间,样本使用CPU将数据编码到由SourceTextureArguments
结构定义的参数缓冲区中。
typedef struct SourceTextureArguments {
array<texture2d<float>, AAPLNumTextures> textures [[ id(AAPLArgumentBufferIDTextures) ]];
} SourceTextureArguments;
此参数缓冲区由_sourceTextures
缓冲区支持,可通过updateInstances
函数中的source_textures
变量进行访问。source_textures
包含由样本渲染器加载的纹理的引用数组。
在初始化之后,对于每个帧,样本使用GPU将数据编码到由InstanceArguments
结构定义的单独的参数缓冲区中。
typedef struct InstanceArguments {
vector_float2 position;
texture2d<float> left_texture;
texture2d<float> right_texture;
} InstanceArguments;
此参数缓冲区由_instanceParameters
缓冲区支持,可通过updateInstances
,vertexShader
和fragmentShader
函数中的instance_params
变量进行访问。 instance_params
是一个结构数组,其数据在计算传递中填充,然后通过实例化绘制调用在渲染过程中访问。
Create an Array of Argument Buffer Structures - 创建一个参数缓冲区结构数组
该示例定义了一个InstanceArguments
结构,其中包含计算函数updateInstances
,对矢量和两个纹理进行编码。
typedef struct InstanceArguments {
vector_float2 position;
texture2d<float> left_texture;
texture2d<float> right_texture;
} InstanceArguments;
前一个参数缓冲区样本使用encodedLength
属性直接确定支持参数缓冲区结构的MTLBuffer
所需的大小。 但是,此示例需要为后续渲染过程渲染的每个四边形提供此结构的一个实例。 因此,该示例将encodedLength
的值乘以实例总数,该实例总数由AAPLNumInstances
常量的值定义。
NSUInteger instanceParameterLength = instanceParameterEncoder.encodedLength * AAPLNumInstances;
_instanceParameters = [_device newBufferWithLength:instanceParameterLength options:0];
注意:
[[id(n)]]
属性限定符不是在此示例中定义InstanceArguments
结构所必需的。 仅当通过Metal API
使用CPU对参数进行编码时才需要此限定符,而不是在通过图形或计算函数使用GPU对参数进行编码时。
Encode an Argument Buffer with a Compute Function - 使用计算函数对参数缓冲区进行编码
对于要渲染的每个四边形,样本执行updateInstances
计算函数以确定四边形的位置和纹理。 样本执行的计算过程遍历instance_params
数组,并为每个四元组编码正确的数据。 该示例通过在instanceID
索引值处设置数组元素中的InstanceArguments
值,将数据编码为instance_params
。
device InstanceArguments & quad_params = instance_params[instanceID];
// Store the position of the quad
quad_params.position = position;
// Select and store the textures to apply to this quad
quad_params.left_texture = source_textures.textures[left_texture_index];
quad_params.right_texture = source_textures.textures[right_texture_index];
Render Instances with an Argument Buffer - 使用参数缓冲区渲染实例
该示例发出实例化绘制调用以呈现四边形,同时产生最小量的CPU开销。 将此技术与参数缓冲区相结合,允许样本在同一个绘制调用中为每个四元组使用一组唯一的资源,其中每个实例绘制一个四元组。
该示例在顶点和片段函数的签名中声明了一个instanceID
变量。 渲染管道使用instanceID
索引到以前由updateInstances
计算函数编码的instance_params
数组。
在顶点函数中,instanceID
被定义为具有[[instance_id]]
属性限定符的参数。
vertex RasterizerData
vertexShader(uint vertexID [[ vertex_id ]],
uint instanceID [[ instance_id ]],
device AAPLVertex *vertices [[ buffer(AAPLVertexBufferIndexVertices) ]],
device InstanceArguments *instance_params [[ buffer(AAPLVertexBufferIndexInstanceParams) ]],
constant AAPLFrameState &frame_state [[ buffer(AAPLVertexBufferIndexFrameState) ]])
顶点函数从参数缓冲区中读取位置数据,以在drawable
中的正确位置渲染四边形。
float2 quad_position = instance_params[instanceID].position;
顶点函数然后通过RasterizerData
结构和[[stage_in]]
属性限定符将instanceID
变量传递给fragment
函数。 (在fragment
函数中,通过in
参数访问instanceID
。)
fragment float4
fragmentShader(RasterizerData in [[ stage_in ]],
device InstanceArguments *instance_params [[ buffer(AAPLFragmentBufferIndexInstanceParams) ]],
constant AAPLFrameState &frame_state [[ buffer(AAPLFragmentBufferIndexFrameState) ]])
片段函数从参数缓冲区中指定的两个纹理中进行采样,然后根据slideFactor
的值选择输出样本。
texture2d<float> left_texture = instance_params[instanceID].left_texture;
texture2d<float> right_texture = instance_params[instanceID].right_texture;
float4 left_sample = left_texture.sample(texture_sampler, in.tex_coord);
float4 right_sample = right_texture.sample(texture_sampler, in.tex_coord);
if(frame_state.slideFactor < in.tex_coord.x)
{
output_color = left_sample;
}
else
{
output_color = right_sample;
}
片段函数输出所选样本。 左侧纹理从左侧滑入,右侧纹理向右滑动。 在右纹理完全滑离四边形之后,样本将此纹理指定为下一个计算过程中的左纹理。 因此,每个纹理在四边形网格上从左向右移动。
在此示例中,您学习了如何使用图形或计算函数将资源编码为参数缓冲区
后记
本篇主要讲述了具有GPU编码的参数缓冲区,感兴趣的给个赞或者关注~~~