Metal框架详细解析(七) —— 关于GPU Family 4之关于光栅顺序组(四)

版本记录

版本号 时间
V1.0 2018.10.06 星期六

前言

很多做视频和图像的,相信对这个框架都不是很陌生,它渲染高级3D图形,并使用GPU执行数据并行计算。接下来的几篇我们就详细的解析这个框架。感兴趣的看下面几篇文章。
1. Metal框架详细解析(一)—— 基本概览
2. Metal框架详细解析(二) —— 器件和命令(一)
3. Metal框架详细解析(三) —— 渲染简单的2D三角形(一)
4. Metal框架详细解析(四) —— 关于GPU Family 4(一)
5. Metal框架详细解析(五) —— 关于GPU Family 4之关于Imageblocks(二)
6. Metal框架详细解析(六) —— 关于GPU Family 4之关于Tile Shading(三)

About Raster Order Groups - 关于光栅顺序组

了解精确控制访问相同像素坐标的并行片段着色器线程的顺序。


Overview - 概览

Metal 2引入了栅格顺序组,可以从片段着色器中进行有序存储器访问,并简化渲染技术,例如与顺序无关的透明度,双层G缓冲区和体素化(voxelization)

给定一个包含两个重叠三角形的场景,Metal保证在绘制调用顺序中进行混合,从而产生三角形连续渲染的错觉。 图1显示了一个绿色三角形部分遮挡的蓝色三角形。

然而,在幕后,这个过程是高度平行的;多个线程同时运行,并且无法保证后三角形的片段着色器在前三角形的片段着色器之前已执行。 图1显示虽然两个线程同时执行,但是在绘制调用顺序中进行混合。

Figure 1 Blending of two triangles in draw call order

片段着色器中的自定义混合函数可能需要在根据前三角形片段应用该函数之前读取后三角形片段着色器的结果。 由于并发性,此读取 - 修改 - 写入序列可以创建竞争条件。 图2显示了线程2试图同时读取线程1正在写入的相同内存。

Figure 2 Attempting to simultaneously read and write the same memory

Raster Order Groups for Overcoming Access Conflict - 用于克服访问冲突的光栅顺序组

光栅顺序组通过同步以相同像素坐标和样本为目标的线程(如果激活每个样本着色)来克服此访问冲突。 您可以通过使用属性限定符注释指向内存的指针来实现栅格顺序组。 然后通过每个像素的提交顺序完成对这些指针的访问。 硬件在当前线程继续之前等待与当前线程重叠的任何旧片段着色器线程完成。

图3显示了栅格顺序组如何同步两个线程,以便线程2在尝试读取该内存之前等待写入完成。

Figure 3 Synchronized threads serially reading and writing the same memory

Extended Raster Order Groups with Metal 2 on A11 - 在A11上使用Metal 2扩展光栅顺序组

A11上的Metal 2扩展了具有附加功能的栅格顺序组。 首先,它允许同步图像块和线程组存储器的各个通道。 其次,它允许创建多个订单组,为您提供更细粒度的同步,并最大限度地减少线程等待访问的频率。

A11图形处理单元(GPU)上的光栅顺序组的附加功能提高性能的示例是延迟着色。 传统上,延迟着色需要两个阶段。 第一阶段填充G缓冲区并生成多个纹理。 第二阶段消耗这些纹理并计算着色结果以渲染光量,如图4所示。

Figure 4 Deferred shading implemented in two phases

因为中间纹理被写入设备存储器(device memory)并从设备存储器读取,所以延迟着色是带宽密集的。 A11 GPU能够利用多个顺序组将两个渲染阶段合并为一个,从而消除了对中间纹理的需求。 此外,它可以将G缓冲区保持在仍保留在本地图像块存储器中的区块大小的块( tile-sized chunks)中。

为了演示A11 GPU的多个顺序组如何提高延迟着色的性能,图5显示了传统GPU如何为照明阶段调度线程。 负责第二个灯的线程必须等待先前线程的完成访问才能开始。 即使访问不相互冲突,此等待也会强制执行这两个线程以串行方式运行。

Figure 5 Scheduling threads for a deferred shading lighting phase

图6显示了多个顺序组如何允许您同时运行非冲突读取,两个线程在执行结束时进行同步以累积灯光。 您可以通过将三个G缓冲区字段(反照率,法线和深度(albedo, normal, and depth))声明为第一组,并将累积的光照结果设置为第二组来实现此目的。 A11 GPU能够分别对两组进行排序,而对第二组的写入不需要在第一组中进行读取等待。

Figure 6 Scheduling threads with raster order groups

使用多个顺序组,更多线程可以同时运行,从而实现更多并行性和更高的性能。

后记

本篇主要讲述了光栅顺序组,感兴趣的给个赞或者关注~~~

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,874评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,102评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,676评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,911评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,937评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,935评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,860评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,660评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,113评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,363评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,506评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,238评论 5 341
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,861评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,486评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,674评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,513评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,426评论 2 352

推荐阅读更多精彩内容