平时在工作中经常遇到各种跟坐标系相关的概念,比如Clip Space等,由于并非日夜相对,因此也常常忘记其原本的含义,为了避免查阅资料的重复劳动,此处将相关概念整合到一起,方便需要时能够迅速检索。
1. 空间坐标系
我们知道,在图形学中,是存在着多套坐标系的,比如世界坐标系,相机坐标系等,而之所以使用多套坐标系,而不将它们完全统一成一套坐标系,是因为同一套坐标系在不同的应用场景中可能会存在这样那样的理解与使用上的问题,当然这也就为我们学习与工作中的使用与理解带来了困难。
1.1 世界空间坐标系
世界空间坐标系,简称世界坐标系,指的是将整个世界(比如地图)包裹起来的一个四维坐标系,这个坐标系同时也称为全局坐标系(所有物件公有的一套坐标系)或者绝对坐标系(不随视角或者其他因素而变化)。
场景中的每个物件在世界坐标系中都有一套对应的坐标或者更广泛的说Transform(包含Position/Rotation/Scale等数据),这套Transform是相对于世界坐标系约定的原点以及正向XYZ坐标轴而给定的。
世界坐标系比较简单,也很容易理解,这里就只做下简单介绍。
1.2 模型空间坐标系
模型坐标系是一套三维局部坐标系,是出于编辑方便的考虑,以模型上某点(通常是中心点)为原点,约定三个正交方向为XYZ正方向的坐标系。
模型坐标系通常用于建模软件以及引擎编辑器的模型编辑等界面中,模型自身相关的顶点等数据通常是按照模型坐标系进行存储的,在渲染使用的时候,需要通过自身相对于世界坐标系的Transform将之转换到世界坐标系中。
1.3 相机空间坐标系
相机坐标系也是一套四维全局坐标系,对应的是以相机为原点,以相机LookAt方向为Z轴正方向的坐标系,这个坐标系是出于获取以观察者(玩家或者相机)为参考原点的相对坐标的需要而建立的,一个静态模型在相机空间坐标系中的位置信息会随着相机的移动与旋转而变化。
1.4 裁剪空间坐标系
裁剪坐标系(Clip Space)指的是相机坐标系经过投影矩阵转换后得到的空间坐标系,之所以叫裁剪坐标系,是因为投影矩阵约定了视角的上下左右前后边界(对应的是相机的Frustum范围),后面会将处于边界之外的数据直接Clip到边界上。
通常,Vertex Shader输出的顶点坐标就处于这个坐标系中,后面硬件会自动根据裁剪坐标剔除掉越界部分,假设某个点的坐标为(x, y, z, w),那么XY方向上处于[-w, w]之外的内容会被剔除,Z方向上在OpenGL中也是[-w, w],而在DirectX中,则是[0, w]。
1.5 标准设备坐标系
与裁剪坐标系相关的一个概念叫标准设备坐标(Normalized Device Coordinates,简称NDC),实际上这个坐标跟我们说的裁剪坐标系中的坐标并不是同一个东西,所谓的NDC指的是与设备平台无关的一套三维坐标系(比如同一个物件,无论设备使用什么样的分辨率,在这个坐标系中的数值都是相同的)。
标准设备坐标系与裁剪坐标系的关联与区别在于,NDC是裁剪坐标系中的四维坐标clip除以第四维齐次坐标分量clip.w后得到的,而这个过程称之为透视除法(perspective division),是在VS之后,硬件自动完成的,经过透视除法后,就完成了坐标从四维空间到三维空间的转换。
在正交投影作用下,因为clip.w通常是1,因此裁剪坐标系的坐标与NDC坐标在数值上是相同的。
与前面的空间坐标系不同,NDC是有边界的,以OpenGL为例,其XYZ方向上的边界为[-1, 1],DirectX(包括Vulkan与Metal API)的NDC范围有所不同,主要在Z轴方向上,其范围为[0, 1]。
1.6 屏幕空间坐标系
屏幕空间坐标系是一个二维平面坐标系,这个坐标系的坐标也是Fragment Shader、Pixel Shader的输入。上一步我们得到NDC之后,坐标范围分布在[-1, 1](OpenGL为例),而之后则需要经过Viewport Transform将NDC转换到屏幕空间,得到与屏幕分辨率相一致的2D整数坐标系(更准确的说,坐标范围与Viewport分辨率一致)。
处于这个坐标系中的坐标,我们称之为Framebuffer Coordinates或者Viewport Coordinates,对于DirectX、Vulkan以及Metal API而言,Framebuffer Coordinates的原点(0, 0)在左上角(y down),而对于OpenGL API而言,其坐标原点在左下角(y up)。另外,贴图坐标系的指向也跟上述规则一样,即贴图坐标系与Framebuffer Coordinates具有相同的坐标轴朝向,这不难理解。
这里需要注意的是NDC的坐标指向与这里的规则有所不同:对于Vulkan API而言,NDC的最小坐标(-1, -1)在左上角(y down),而对于DirectX、Metal、OpenGL API而言,其最小坐标点在左下角(y up)。
我们平常所说的BackFace Culling(CW/CCW)等,就是在这个阶段完成的,之所以不放到NDC中,是因为除以w这个过程可能会导致三角形顶点绕行顺序发生变化;此外,对于Vulkan以及OpenGL的一些在viewport transform之前对Y进行翻转的扩展(比如VK_KHR_maintenance),可能会导致顶点绕行顺序发生变化,从而导致裁剪效果存在异常,这也是需要注意的。在完成这个Culling之后,就会进入光栅化逻辑。
1.7 各坐标系在管线上的位置与关系
模型渲染始于模型空间坐标系,终于屏幕空间坐标系,而中间穿插着剩余的多套坐标系之间的转换,这些坐标系之间的关系如下图(参考文献[1])所示:
1.8 贴图坐标系
当我们需要对贴图进行采样,或者进行数据写入时,就需要指定读取以及写入时的坐标,这个时候使用的这个坐标叫做贴图坐标系。
贴图坐标系与Framebuffer Coordinates十分相似,也有着相同的坐标原点,不同的是,贴图坐标系支持浮点数,浮点数作用下可以实现对贴图数据的双线性采样(或者volume texture的三线性采样)。
对于贴图坐标系,我们还可以继续划分为贴图上传(数据存储)时的坐标系——这个会影响先传输顶部行数据还是先传输底部行数据,以及贴图采样(读取)时的坐标系——这个对应的是shader采样时以左上角为原点还是以左下角为原点,当这两个坐标系一致时,我们在shader中采样得到的数据就是符合预期的,否则可能会导致错误。
1.9 Window坐标系
所有操作系统的窗口坐标系,其原点都在左上角,因此对于OpenGL等以左下角为原点的API而言,在最终提交Framebuffer时,就需要对其进行上下翻转(Flip Y)。
1.10 各坐标系Y轴朝向[2]
API / Coordinates | NDC | Framebuffer | Texture | Window |
---|---|---|---|---|
DirectX | Up | Down | Down | Down |
OpenGL | Up | Up | Up | Down |
Vulkan | Down | Down | Down | Down |
Metal | Up | Down | Down | Down |