欢迎前往个人博客 驽马点滴 和视频空间 哔哩哔哩-《挨踢日志》
2.1 综述
流水线
在工业上,流水线被用在装配线上。未引入流水线之前,一个产品的生产有多个环节,需要等上一个环节完成,才能进入下一个环节。生产的时间等于各个环节的时间之和。在引入流水线后,各个环节同时进行,正常运行时,生产的时间由最慢的那一环节决定。
渲染流水线
在 Real-Time Rendering, Third Edition 一书中,将渲染流程按先后顺序分为三个阶段:应用阶段、几何阶段、光栅化阶段。
应用阶段由应用主导(开发者控制),一般在 CPU 中进行。首先,要准备好场景数据,例如摄像机位置、视锥体、场景中包含哪些模型、使用了哪些光源等等;其次,为了提高渲染性能,需要做粗粒度剔除(culling),避免将工作移交给几何阶段处理;最后,需要设置好每个模型的渲染状态,这些状态包括但不限于材质(漫反射颜色、高光反射颜色)、纹理、Shader;应用阶段输出的内容为渲染所需的几何信息(简单说就是点、线、三角面等信息),即渲染图元(Rendering Primitive),这些信息会被传递给渲染的下一个阶段——几何阶段。
应用阶段从 CPU 和 GPU 交互层面来说,可以分为三个阶段:
- 把数据加载到显存中;
- 设置渲染状态;
- 调用 Draw Call;
几何阶段处理所有和我们要绘制的几何相关的事情。例如,决定需要绘制的图元有哪些、怎样绘制这些图元、在哪里绘制它们。这一阶段通常在 GPU 上进行。几何阶段的一个重要任务是把顶点坐标转化到屏幕坐标,再交付给光栅器处理。通过对输入的渲染图元进行多步处理后,这一阶段将会输出屏幕空间的二维顶点坐标、每个顶点对应的深度值、着色等相关信息,并传递给下一个阶段——光栅化阶段。
光栅化阶段会使用上一阶段传递的数据来产生屏幕上的像素,并渲染出最终的图像。这一阶段也是在 GPU 上运行的。光栅化的主要任务是决定每个渲染图元中的哪些像素应该被绘制在屏幕上。它需要对上一个阶段得到的逐顶点数据(例如纹理坐标、顶点颜色等)进行插值,然后进行逐像素处理。
2.2 CPU 和 GPU 之间的通信
渲染流水线的起点是应用阶段。应用阶段大致分为一下三个部分:
把数据加载到显存中;
设置渲染状态;
调用 Draw Call;
2.2.1 把数据加载到显存中
所有数据都是从硬盘(HDD, Hard Disk Drive)中加载到内存(RAM, Random Access Memory)中,然后网格、纹理等数据又被加载到显存(VRAM, Video Random Access Memory)中。这是因为,显卡对显存的访问速度更快,而大多数显卡对 RAM 没有直接的访问权限。
2.2.2 设置渲染状态
什么是渲染状态?通俗的解释是,这些状态定义了场景中的网格是怎样被渲染的。例如,使用了哪个顶点着色器/片元着色器、光源、材质等。如果没有更改渲染状态,那么所有的网格将使用同一种渲染状态(五角星、三角形、圆形显示出相同的效果,只是形状不一样)。
2.2.3 调用 Draw Call
Draw Call 是一个由 CPU 向 GPU 发起的指令。渲染状态已经准备就绪,CPU 向 GPU 发起 Draw Call 指令,指令指向一个渲染图元列表。GPU 根据渲染状态和所有输入的顶点信息,最终输出成屏幕上显示的像素,该过程即是 GPU 流水线。
2.3 GPU 流水线
2.3.1 概述
顶点数据 ->(几何阶段:顶点着色器->曲面细分着色器->几何着色器->裁剪->屏幕映射)->
(光栅化阶段:三角形设置->三角形遍历->片元着色器->逐片元操作)->屏幕图像
2.3.2 顶点着色器
顶点着色器(Vertext Shader)是流水线的第一个阶段,主要完成的功能有:坐标变换、逐顶点光照、输出后续阶段所需要的数据。
坐标变换:把顶点坐标从模型空间转换到齐次剪裁空间。NDC (Normalized Device Coordinates)
2.3.3 裁剪
裁剪(Clipping):将部分在视野内的图元进行处理。将图元裁剪到单位立方体中。
2.3.4 屏幕映射
屏幕映射的输入仍然是三维坐标,其任务是把每个图元的 x 和 y 坐标转换到屏幕坐标系(Screen Coordinates)下。而 z 坐标不会被处理,屏幕坐标和 z 坐标一起构成了窗口坐标系(Window Coordinates)。这些值会被传递到光栅化阶段。
注意:屏幕坐标系在 OpenGL 和 DirectX 之间的差异。OpenGL 以屏幕左下角为原点,DirectX 以屏幕左上角为原点。
2.3.5 三角形设置
三角形设置这步开始,就进入光栅化阶段了。上一步骤的输出是屏幕坐标系下的三角网格的各个顶点信息。为了渲染出三角网格对应屏幕上的像素点的情况,需要计算三角网格每条边的表示方式。这样一个计算三角网格表示数据的过程就叫做三角形设置。
2.3.6 三角形遍历
三角形遍历阶段会检查每个像素是否被一个三角网格所覆盖。如果被覆盖,就会生成一个片元(fragment)。而这样一个找到哪些像素被三角网格覆盖的过程就是三角形遍历。该阶段也称为扫描变换(Scan Conversion)。
三角形遍历会使用三角网格3个顶点信息对其覆盖的像素进行插值。
三角形遍历的输出:片元序列。一个片元是包含了很多状态的集合。(片元)=(屏幕坐标、深度信息、顶点信息(法线、纹理坐标等))。
2.3.7 片元着色器
片元着色器(Fragment Shader)的输入是上一个阶段对顶点信息插值得到的结果。它的输出是一个或者多个颜色值。
片元着色器完成的一个重要任务是纹理采样。
2.3.8 逐片元操作
逐片元操作(Per-Fragment Operations)是 OpenGL 中的说法,在 DirectX 中,这一阶段被称为输出合并阶段(Output-Merger)。
这个阶段首先解决片元可见性问题。通过 片元->模版测试->深度测试->混合->颜色缓冲区 的操作进行。
事实上,测试顺序并不是唯一的,GPU 会尽可能在进行片元着色器之前进行这些工作(比如说 Early-Z 技术)。
欢迎前往个人博客 驽马点滴 和视频空间 哔哩哔哩-《挨踢日志》