简述
Rendering Pipeline:用于生成2D图片。
Architecture
Pipeline由一系列阶段组成,每一部分执行总体任务的一部分。
管线的各个阶段并行的运行着,如果一个任务由N个阶段的管线来执行,理论上可以达到N倍的效率,管线的效率由效率最低的阶段决定。
RenderingPipe的粗粒度划分:
Application=>Geometry Processing=>Rsterization=>Pixel Processing,其中每个阶段也可以是管线化的(划分成阶段,然后并行)。
Application Stage
这一阶段通常在cpu上进行,我们对这一阶段有着更多的控制能力,输出数据到Geometry Processing Stage(Triangle,Line,Point等)。另外可以通过Compute Shader使用GPU来进行这一阶段的业务处理。
通常有碰撞,物理,剔除,输入输出等任务。
Geometry Processing
这一阶段通常在GPU上进行,处理对象通常是顶点与三角面,可以划分为子阶段
Vertex Shading=>Projection=>Clipping=>ScreenMapping
Vertex Shading
变换几何体元数据的位置信息,输出一些材质基本属性(UV,Vertex Normal,Vertex Color)。
空间变换:Model=>World=>View=>Clip。
View变换矩阵以相机aim方向为Z,UP为Y,Right为X构建矩阵。
变换类型:orthanographic(是平行投影的一种,另外还有oblique,axonometric)和perspective。
变换之后的坐标在齐次空间中,z值没有被w值除
所有的变换将view volume变换为canonical view volume(cvv),其标准极点为(1,1,1),(-1,-1,-1),在DX中,极点为(1,1,1),(-1,-1,0)
其他的Vertex Processing
tessellation,geometry shading,stream output等
Tessellation
hull shader=>tessellator=>domain shader
使用Vertex来表示Curved Surface,Curved Surface可以被分解为Patch,这些Patch是一系列的顶点。
Tessellation使用Patch数据生成大量的顶点,再由这些顶点生成大量的三角面。可以通过相机距离决定Patch的细分程度。
Gemotry Shader
比Tessellation出生的年代更早,在GPU硬件中也更常见,比如可以用于生成Particle.例如一个Particle Explosion,每个效果单元使用点,或者vertex表示,在geometry shader中,可以将其转化为一个面向相机的正方体。
Steam output
把GPU作为Geometry计算引擎,并将结果保存在数组中,结果可以供CPU或者GPU使用,常见的用法是在粒子模拟(虚幻中的GPU Particle)
顺序为Tesselation=>Geometry Shader=>Stream Output
Clipping
在view volume中的Primitive会被绘制,在view volume之外的Primitive不会被绘制,如果一个primitive一部分在view volume中,一部分不再其中,那么该primitive就会被clipping,clipping过程会产生新的定点并重新组装primitive.
因为clipping在projection之后,所以clipping完全在unit cube(cvv)中进行,该设计的好处在于:使得clipping的操作比较简单,并具有一致性(consistent)。
clipping通过cvv的6个面来进行,同时用户可以定义自己的平面来对primitive进行裁剪(user clip plane).
clip使用的坐标为齐次坐标,在使用透视投影的时候,坐标并没有得到标准的线性插值,所以需要第4个值(w)来进行正确的插值和裁剪。最后perspective division被执行,三角面的的位置被防止到normalized device coordiantes(ndc).
Screen Mapping
当进入此阶段时,坐标任然是3D坐标,x,y映射到屏幕坐标(screen coordinate),z值(opengl(-1,1),dx(0,1)映射到(0,1),(x,y,z)和起来称为窗口坐标(window coordinate),窗口坐标会传递到rasterizer stage.
dx10之后的api以及opengl都把0.5当作像素的中心
dx的左上角是(0,0),opengl的左下角是(0,0)[笛卡尔坐标系].
Rasterization
这一个阶段的目标是找到primitve内的所有pixel或者sample
分为两个阶段:
Triangle Setup
Triangle Traversal
Rasterization是Geometry Processing与Pixel Processing的同步点
如何判断primitive是否占据某个像素?
比较简单的办法是计算primitive是否覆盖像素的中心,conservative rasterization是通过判断primitive有没有在一个像素内。
Triangle Setup
differentials,edge equations,以及其他的primitive data被计算出来,用于接下来的Triangle Traversal计算。
Triangle Traversal
检查哪些像素/sample在三角面中,同时提供perspective-correct interpolation.向pixel processing stage提供像素/sample.
Pixel Processing
分为两个子阶段,pixel shading和merging
Pixel Shading
使用插值之后的shading data作为输入,最终输出结果为一个或者多个color.通常使用可编程gpu core作为执行单元。输出的颜色传递到merging阶段。
Merging
也叫ROP(raster operation pipeline),或render output unit.一般不可编程,但在配置性上比较灵活。
为了防止人眼观察显卡绘制pritive的过程,可以使用double buffer.