试验设计之所以需要,是因为我们的实验往往存在许多不同的情况,如果情况很多,通过排列组合一一验证费时费力,有些情况甚至难以施展。有时我们刻意设计一系列试验,以便筛选出所需的“阳性”。另一种情况是为解释自然界的某种现象时,需用统计学原理模拟与验证,从而得以让人信服为之而提出的假说,验证思想与试验设计思想不谋而合。
从中可以明了,试验设计的目的是为实验提供科学指南与分析模式,通过减少实验次数降低成本(时间、人力、物力);减少数据量,但不减少信息,有利于分析。下面简介3种常用的试验设计方法。
一、完全随机化试验(completely randomalized design)
又称“随机完全区组设计”等。这种方法最简单,但有时却万分有效。用该方法设计实验的目的是要验证一种因素对实验对象的影响。通常在相同条件下,设计n个区组,区组通常是条带状。某一因素在各区组间水平(值)不同,但区组内因素的水平(值)是恒定的。区组里的实验对象为无差别的随机个体。
例如,在三个不同来源统一年龄的杉木幼苗(三个家系)中,有其中一个家系看上去较高大,似乎能够区别于其它,但无法确定的是这一性状是否稳定,或许是否在统计上有差别时。此时通过完全随机化试验进行评估。将三个家系的所有幼苗种植于相同的环境中,相同家系的种在一起。该例所谓的“一种因素”是家系,其余条件均相同。获取的树高用于单因素方差分析(one-way ANOVA),结果能评估“家系”这一因素对杉木生长产生的效果。
二、随机区组设计(randomized block design)
由于多数实验的影响因素不只一个,或难以控制为一个,此时就需进行随机区组设计。该设计的目的是评价一个实验中实验对象受两个因素同时作用时,这两个因素的主次与效果。通常的做法是在完全随机化试验的基础上,每个区组内部有由某因素不同水平的处理。
例如,上述3个家系的杉木,现在不再种植于相同的环境中,而是种在3种不同氮素含量的土地上。该设计的目的不再是评价家系对杉木生长的影响,而变为生长最好的杉木,家系以及土壤氮素含量是怎样的,以及这种最好的生长状况相较于平均水平有显著性吗?因为我们想知道各家系的喜氮偏好性并获得最优单株。有时,经双因素方差分析(two-way ANOVA)后开展多重比较(multiple comparisons),还能发现各因素实际作用的相对贡献,从而发现真正导致结果显著的因子。
三、正交试验设计(Orthogonal Experimental Design)
该方法是真正的可减少实验次数的方法,而且非常常用。对两个因素以上的试验,随机区组设计无能为力,而两个因素以上的试验的次数又通常较多,因此根据正交性从全面试验中挑选出部分有代表性的点进行试验,这些有代表性的点具备均匀分散,齐整可比的特点。(图1)
应注意区分试验设计与数据分析,这是两个过程。前者仅仅提供方案,要对所获取的数据进行分析,需依靠方差分析与假设检验等。具体过程参考“试验设计”相关参考书;分析参考《数理统计》等。