Metal与图形渲染四：工具与调试

零. 前言

俗话说，工欲善其事必先利其器，在苹果开发中，XCode给我们提供了众多的debug工具，既然开发工程代码有方便的断点调试机制，那么想必Metal开发也有非常好用的调试手段，今天就来介绍一下如何利用XCode自带的工具调试Metal开发。

这次我们选取的是Metal Sample Code里面的代码，是一个非常非常酷炫的3D带阴影带荧光带光照的特效：

一. 捕获某一帧

首先将代码跑到手机，点击这个小相机按钮，即可捕获到这一帧的信息

下图是这一帧动画的捕获结果，可以看到里面有很多部分，比如G缓冲、光照、阴影等等渲染效果。

我们可以通过setLabel:方法对某些需要重视的缓冲、编码器等进行设置标签，并在Debug导航栏展示。

commandBuffer.label = @"GBuffer & Lighting Commands";

可以对编码器通过pushDebugGroup:和popDebugGroup进行文件夹分级：

/// Draw to the three textures which compose the GBuffer
- (void)drawGBuffer:(nonnull id <MTLRenderCommandEncoder>)renderEncoder
{
    [renderEncoder pushDebugGroup:@"Draw G-Buffer"];
    [renderEncoder setCullMode:MTLCullModeBack];
    [renderEncoder setRenderPipelineState:_GBufferPipelineState];
    [renderEncoder setDepthStencilState:_GBufferDepthStencilState];
    [renderEncoder setStencilReferenceValue:128];
    [renderEncoder setVertexBuffer:_frameDataBuffers[_frameDataBufferIndex] offset:0 atIndex:AAPLBufferIndexFrameData];
    [renderEncoder setFragmentBuffer:_frameDataBuffers[_frameDataBufferIndex] offset:0 atIndex:AAPLBufferIndexFrameData];
    [renderEncoder setFragmentTexture:_shadowMap atIndex:AAPLTextureIndexShadow];

    [self drawMeshes:renderEncoder];
    [renderEncoder popDebugGroup];
}

二. 顶点着色器的Debug

我们点击小虫子按钮就可以出现debug界面啦

选中Vertex可以查看顶点情况，可以看到这个图像由若干个三角形组成，现在我们选中其中一个三角形，点击Debug按钮

这时候就会定位到.metal文件的顶点着色器代码，我们可以看到这个三角形对应的坐标情况，每一步都能看到对应的矩阵信息输出，非常非常方便。

如果渲染时发现图像消失掉了，不妨可以用顶点着色器的Debug，看看对应的三角形到底跑哪去了。

三. 片段着色器的Debug

现在我们用像素查看器定位到闪现荧光的地方，看看荧光对应的片段着色器，我们选中Fragment选项，点击Debug按钮

这时候就可以看到对应的片段着色器的代码了，这个着色器起名为Fairy，营造了一种小精灵的气氛哈哈。我们点击右侧的矩阵还可以看到对应的图片效果，把鼠标放上去还可以看到实时的RGBA，真的非常人性化了。

当然，如果你这时候定位到bug了，对Metal文件一番修改后，想实时查看效果，那么可以点击，我改了一下代码，就实时地把小精灵的气氛毁坏掉了=v=

四. 性能表现的Debug

1. Summary

点击Summary栏，可以看到这个程序有6个命令缓冲区、6个渲染命令编码器、33个描绘指令，渲染一帧大概需要7.03ms，接近60w个顶点，纹理内存102.8MB，缓冲内存3.1MB

而下半部分则是Metal对性能上的一些优化建议，如当我点开BandWidth栏的时候，系统告知这是未被使用的资源。

点击后，系统建议编码完成后如果不需要用这一帧，换成MTLStoreActionDontCare，这样可以省掉8.03MB的大小。

2. Counters

计数器选项可以看到每个分组的一些渲染情况，还可以看到哪些阶段比较耗性能，从而进行排查。

3. Memory

内存选项可以看到内存的情况，纹理和缓冲用了多少内存在这里都一目了然。

4. Pineline State

点击这个按钮，切换到Pineline State

选中一个看上去耗时最长的fragment看看情况

可以看到，该G缓冲着色器总耗时1.39ms，且每一步的一些性能占比情况都展示了出来。

点击饼状图还能看到详情：

根据苹果文档Optimizing Performance with the Shader Profiler，这些性能指标分别代表：

ALU：Arithmetic Logic Unit，逻辑计算单元，负责逻辑运算

Memory：内存，采样、读取和存储操作

Synchronization：同步，等待内存、被阻塞、原子操作

根据苹果文档Reducing Shader Bottlenecks，我们可以通过以下操作提高性能：

如果对精度不那么敏感，可以适当降低精度
使用Metal的快速运算标记flag，只有真正需要用到的时候才使用精确运算flag，这个在Metal Shading Language Guide的1.5章有提到
能用half就用half，不行才用float，避免half和float的相互转换
能采样纹理就不要手动写函数计算，比如相对于写一个噪声点的生成函数，更好的选择是生成一个噪声纹理进行采样。

5. Instrument分析

业界对Instrument的Metal System Trace的分析比较少，找了几个WWDC视频才大致了解。

打开Instrument，Option勾选如下

A13是苹果的Metal Device，而下面的则是各个CPU的占用情况，如果有过高占用的话会很容易看到，从而进行排查。

展开A13又看到几个熟悉的老面孔，顶点和片段着色器，还有一些性能指标

筛选一些数值放大到一次渲染过程看看，可以看到顶点和片段着色器的一些函数执行的流水线，如果需要的话可以定点到具体方法排查。下方还有一些时间信息。

五. 总结

这篇文章主要介绍了如何利用XCode对Metal渲染进行调试，还有介绍了一些性能情况的查看，我们可以通过不同阶段的性能表现来定位哪些函数比较消耗性能，从而优化他们~

参考文章

WWDC2018 Metal Shader Debugging and Profiling

Metal框架详细解析（十八） —— 工具、分析和调试之Metal GPU Capture（二）

Reducing Shader Bottlenecks

WWDC2020 Gain insights into your Metal app with Xcode 12

WWDC2020 Optimize Metal apps and games with GPU counters

最后编辑于：2022.10.26 21:28:25

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 218,451评论 6赞 506
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,172评论 3赞 394
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 164,782评论 0赞 354
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,709评论 1赞 294
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,733评论 6赞 392
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,578评论 1赞 305
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,320评论 3赞 418
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,241评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,686评论 1赞 314
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 37,878评论 3赞 336
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 39,992评论 1赞 348
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,715评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,336评论 3赞 330
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 31,912评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,040评论 1赞 270
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,173评论 3赞 370
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 44,947评论 2赞 355