《实地实验:设计、分析与解释》——艾伦·格伯、唐纳德·格林
世界充满了因果问题,如何令人信服的回答这些问题?
一种通常的做法是,通过直觉(intuition)或奇闻轶事(anecdote)来得出结论。另一种常见的研究策略是尽可能地搜集统计证据,来显示当某种原因存在时,某种结果就更可能出现。
研究者有时会搜集大量数据集,从而让它们来确定某些假定原因和结果之间的相关性。但是相关性并不等于因果性,反而会对其产生某种误导。在解释相关性的时候,研究者必须一直对不可测量特征产生的歪曲影响保持警惕。这种不可测量的特征又被称为“混淆变量”(confounder)、“潜在变量”(lurking variable)或者“不可观测的异质性”(unobserved heterogeneity)。列出所有潜在的混淆变量时不可能的,这将是一个bottomless pit(无底洞),况且搜寻名单的过程也没有一项明确定义的stopping rule(停止规则)。那么,如何解决不可观测混淆变量的影响呢?
实验方法
想要解决不可观测混淆变量的影响,即不需要去识别更不用去测量所有潜在的混淆变量。于是,伟大的前辈们通过几个世纪的探索,发展出了用于分离(sever)干预(treatment)与其他预测结果变量间统计关系的规程(procedure)。通过系统的追踪研究者试试干预效果的方法,来比较干预组与一个或多个控制组的结果差异,而为了消除干预组与控制组之间的系统差异,就不得不提到一个重要的名词:随机分配(random assignment)。
随机分配是区分社会科学中的实验和非实验研究的分界线。随机实验代表了公平判断主张有效性的一种方法,因为它包括了透明且可重复的步骤。
什么是实地实验?
在真实环境下进行的随机研究通常被称为“实地实验”。实地实验的英文为field experiment,根据字面意思很容易让人想到是在“田野”中进行的实验,但是这里的field一词不光指的是田野,也不光指的是实验环境,因为实验环境仅仅是实验的一方面。这里要强调实验的几项准则:研究中使用的干预与显示中感兴趣的介入是否相似,实验参与者与通常接触这种介入的人是否相似,被试接受干预的背景与感兴趣的的背景是否相似,以及结果测量与理论与实践兴趣有关的实际结果是否相似。
实地实验的目的
实验方法可以有大量不同的目的。有时候实验通过检验隐含的因果关系来评价某种理论观点;有时候通过尽可能接近现实并且非介入性的实验来检验更多与背景特征相关的研究假设;而更多的实地实验是以“项目评估”(program evaluation)形式出现的,其目的是为了测量资源使用的效果。
实地实验的优缺点
实地实验由于是在真实环境中进行检验,所以其在项目评估方面能更具优势。但当我们从项目评估转向理论命题检验时,实地与实验室环境的相对优劣就变的不太清晰了,因为在实验室控制条件下进行干预的优势是实用性,可以很容易对干预的变化进行控制,以便检验非常精细的理论命题,而实地干预通常很难做到这一点。另外,开展实地实验的最大缺点便是实施的困难。与实验室相比,实验室中的研究者可以单方面做出采用什么干预的决定,而实地实验通常需要研究者、实施干预者以及结果测量者之间进行协调。
自然发生的实验和准实验
自然试验:包括自然发生的随机实验,任何由偶然和难以理解分配机制产生的观测性研究。
准实验:近似随机或大概属于随机分配的实验。(即准实验没有包含清晰的随机分配过程,因此基于这种研究进行的因果推断有更大的不确定性。)