Unity3D从4的版本开始支持了DirectX 11。也就是说,在Unity3D中可以直接调用经过封装的DirextX API来使用DirectCompute进行并行计算。最近做了一段,发现还是挺好用的,当然也有很多bug在其中。目前google的话,单纯讲Unity3D中如何使用DirectCompute的文章特别少(可能本来这样的需求就少),有的文章又比较独立而且没有深度,大概介绍一个例子就完事儿。边学边做的过程中尽管找到了合适的教程,但还是免不了很多问题。打算先把好的教程翻译过来,这是第一篇。:)
DirectCompute tutorial for Unity 简介 1
我使用Unity大约有两年了。在这之前我都是用C++写程序,并且手动创建图形上下文。我首选的图形API是OpenGL,关于如何写GLSL的shader积累了不少经验。刚开始使用Unity的时候,我选择Cg着色语言。GLSL和Cg差别并不大,要转换也很容易。Unity虽然支持GLSL,但是用的并不多。
现在Unity开始支持微软的DirectX 11,并且带有DirectCompute API。DirectCompute API通过写compute shader开辟了一条使用GPU的新道路。主要问题是,非常缺乏关于怎样使用DirectCompute的教程和文档。Google搜索,微软文档都很少,Amazon上也鲜有关于这个主题的书。如果你正好知道一些好的资源,欢迎在评论的地方发个链接来。
过去几年我尝试收集关于怎样使用这个强大的API方面的信息,但是很少类似信息。所以我觉得自己写个系列教程来介绍怎样在Unity中使用DirectCompute。我会从为什么需要DirectCompute讲起,它和传统的图形管线有什么不同,怎样通过compute shader写kernel函数,GPU内部线程分块怎样工作,怎样访问纹理,怎样使用不同类型的buffer,怎样使用线程同步、共享内存以及最优化性能。
这些教程不要求对Cg shader有任何经验,但是我强烈推荐在开始compute shader之前对Cg shader有一个很好的理解。主要原因是使用compute shader处理出来的数据很可能需要进行可视化,这时候就需要使用Cg shader了。我会讲到怎么去做。compute shader是使用微软的HLSL写的,在此教程中你不需要知道这个语言,当然至少有一种shader语言的基础最好(GLSL/Cg/HLSL)。幸运的是,HLSL和Cg很相似,你设置可能感觉不出来两者区别。首先推荐配置一下compute shader语法高亮的插件,因为Monodevelop默认并没有。
图形管线
要理解为什么要使用DirectCompute,理解一下默认图形管线及其历史是很有帮助的。它起始于90年代早期,当时3D图形越来越流行,GPU也逐渐成为计算机中的标配,开发者需要一个图形API来利用这些强大的设备。1992年,OpenGL1.0发布了,它是SGI公司为其图形工作站开发的IRIS GL。微软最初是OpenGL ARB中的一员,该组织负责OpenGL标准的开发,还包括了SGI,Digital Equipment Corp,IBM,Intel。后来微软离开了ARB,开始开发自己的图形系统Direct3D,作为DirectX API的一部分。后来ARB被Khronos工作组接管,现在的成员还有3Dlabs, ATI, Discreet, Evans & Sutherland, Intel, NVIDIA, SGI and Sun Microsystems.
开发者需要做的是把他们要渲染的几何体送入GPU,OpenGL会把它传入图形管线直到最终输出为屏幕上的像素。尽管开发者可以开关某些特定的部分,配置一些参数,但是这种管线是固定的,可以改变的并不多。这种情况持续了一段时间,随着开发者开始进一步推进GPU,对更高级特性的需求越来越明显,这种管线也要更加灵活。解决方案是使管线的特定部分可编程。开发这可以编写自己的程序来执行管线特定的部分。这些程序就被称之为shader。
新的可编程管线开启了新的可能性,随之而来的是更高质量的图形,这是前一代游戏不具备的。尽管图形管线最初是用来开发图形,新的灵活性意味着GPU可以用来处理多种类型的算法。很多研究迅速展开,修改算法使之在多线程的GPU上执行。物理、财经、数学、医疗等众多领域开始使用GPU处理他们的数据。GPU原始的能力并不好用,因此GPGPU(General Purpose Graphical Processing Unit)编程诞生了。
General Purpose Graphical Processing Unit
GPGPU迅速成为了主流并进入行业领域。然后还有一个问题。图形API仍然与图形管线绑定。shader的灵活性带给你的只是图形管线的一个阶段,他们仍然受到管线的限制。顶点shader需要输出顶点,片元shader需要输出像素。然而大量的工作需要GPGPU必须改变。需要一个API把开发者中图形管线的束缚中释放出来,并且提供一个在与图形无关的设置中使用GPU的环境。
接下来的几年,GPGPU的API开始出现,现在的开发者还能够在CUDA,OpenCL,DirectCompute中进行选择。这些新的API开辟了使用GPU的新道路,再也不需要与传统图形管线绑定了。尽管还有一些限制,但是与在一个多线程环境中工作相比,太微不足道了。
游戏产业最渴望使用GPU这种新能力。随着游戏越来越真实,他们开始模拟真实世界中的物理现象。这些计算通常很复杂,需要很多的处理。GPGPU提供的能力和灵活性可以是这些计算做的更细、范围更大。原始的图形API为我们习以为常的3D游戏开创了新的世界,而新的GPUGPU API也在游戏行业中开辟了新纪元。当代的游戏将会被这些API的使用所统治,将会有更真实的图形和物理效果。
你需要做的就是学会如何使用它们。下一篇将会告诉你怎样建立kernel函数以及线程块是怎样工作的。