如何利用计量经济学的方法进行因果推断（一）

本文是在我在这学期听了北京大学国发院2019年春季学期沈艳老师开设的《高级计量经济学2》后对因果推断部分的总结，主要涉及DID、RD、倾向得分匹配、HCW及合成控制法等计量方法。

因为文章包含了很多我个人的理解，免不了有所疏漏或者有理解不到位之处，还请大家批评指正。大家如果有兴趣对因果推断的方法进一步探究，可以阅读我在文章最下方列出的课程参考文献以及我自己认为对理解因果推断很有帮助的一些文章。

首先，什么是因果推断？我认为因果推断是用已有的证据去证明两件事、两个变量之间的因果联系，比如证明教育年限对于工资水平的影响，或者是气候变化对于农作物产量的影响，这里的教育年限和气候变化就是因，而工资水平和农作物产量则是果。

用于验证因果关系最理想的办法，自然是做实验。继续上文教育年限和工资水平的例子，我们如果想证明教育年限对于工资水平有影响，在理想状态下应该找一群人，控制他们的性别、年龄、智商等等所以可能影响工资水平的因素不变化，而只让教育年限发生变化，来观察工资水平是否会发生变化以及发生多大的变化。但现实中，尤其是对于社会学科来说，通常的研究对象是人，很难像自然科学一样在可以对各变量进行严格控制的环境下进行实验，所以就又有了下面我们要讲的方法。

第一种是随机控制实验（random control trial），也就是近些年比较火的RCT方法。用药品测试作为例子，为了测试某种新药到底有没有效果，药品公司招募了一批符合条件的被试者，将这些被试者随机分入控制组或者实验组。控制组仅发放安慰剂，而实验组则会发放真正的药品，但是被试者并不知道发放到自己手中的药品究竟是安慰剂还是开发的新药。在实验结束以后，对比实验组与控制组的相应身体指标，二者之间的平均差异就是新药的效果。

第二种是自然实验（natural experiment）或者准实验（quasi-experiment）。这类实验主要是指由于某些外部突发事件，使得当事人仿佛随机地被分配到了实验组和控制组，因而可以进行比较，探究是否存在因果关系。通过个体分组是否完全取决于这一突发事件，我们又可以进一步将其分为两类实验：第一类个体分组完全取决于突发事件，比如1992年，美国新泽西州通过法律将最低工资从每小时4.25美元提高到5.05美元，但在相邻的宾夕法尼亚州最低工资依然保持不变，这两个州的雇主仿佛被随机地分配到实验组（新泽西州）与控制组（宾夕法尼亚州）。这类自然实验可以直接用OLS估计因果效应。第二类个体分组只是部分地由自然实验所决定，如Angrist(1990) 考察越战期间的参军者，当时美国对全国年轻男子以生日抽签的方式进行征兵，尽管抽签完全随机，但是否参军取决于体检，且有些人得到豁免，另一些人未抽中却自愿参军，此时应以自然实验所带来的随机变动作为工具变量。

那在介绍完以上的实验之后，我们正式进入因果推断的框架。我们这里主要用到的是RCM的模型，即Rubin Causal Model (RCM; Rubin 1978)。首先我们引入潜在因变量的概念。

什么叫做潜在因变量呢？例如一个人上了大学，我们想研究上大学这一事件对于他的收入带来了多大的提升，这一提升叫做上大学这一事件的处理效应。为了计算这一处理效应，我们就要对这个人上了大学的收入和没上大学的收入两者相减。但在实际情况中，我们只能观察到他上了大学的收入，而无法观察到他没上大学的话收入是多少，因为一个人无法像薛定谔的猫一样同时兼具两种状态，要么是生，要么是死，一旦一种状态被确定，另一种状态下发生的事情就无法观测到了。此时，这个无法观测到的因变量就叫做潜在因变量。那我们引入以下的一些notation。

接下来我们就要定义所谓的处理效应。因为总体可以分为实验组和控制组，相应在总体、实验组和控制组三个层面上就有三种处理效应。用我们上面提到的总体处理效应是指总体随机分配个体到实验组与控制组所得到的处理效应，即 $\tau_{P}=E\left[Y_{i}(1)-Y_{i}(0)\right]$ 。而实验组处理效应为 $\tau_{P T}=E\left[Y_{i}(1)-Y_{i}(0) | W=1\right]$ 。控制组的处理效应为 $\tau_{U T}=E\left[Y_{i}(1)-Y_{i}(0) | W=0\right]$ 。这三者之间的关系是 $\tau_{P}=\operatorname{Pr}(W=1) \tau_{P T}+\operatorname{Pr}(W=0) \tau_{U T}$ ，即总体处理效应是实验组处理效应与控制组处理效应的权重加总。

在现实中由于潜在因变量的问题，我们往往无法估计以上三种处理效应。我们往往通过比较实验组与处理组的平均差异来近似个体处理效应，即：

$\frac{1}{N_{T}} \sum_{i : W_{i}=1}^{N} Y_{i}-\frac{1}{N-N_{T}} \sum_{i : W_{i}=0}^{N} Y_{i}$

当 $N \text { and } N_{T}$ 趋于无穷时，该值依概率收敛于 $E\left(Y_{i} | W_{i}=1\right)-E\left(Y_{i} | W_{i}=0\right)$ ，经过一番操作后可以化为

$\begin{array}{l}{\left\{E\left[m_{1}(X)-m_{0}(X) | W=1\right]\right\}} {+\left\{E\left(m_{0}(X) | W=1\right)-E\left(m_{0}(X) | W=0\right)\right\}} {+\{E[\varepsilon(1) | W=1]-E[\varepsilon(0) | W=0]\}}\end{array}$

第一个花括号内即为实验组的处理效应，第二个花括号内是由实验组和控制组解释变量差异带来的混淆效应，即实验组和控制组个体本身的异质性，第三个花括号内是实验组和控制组个体不可观测因素带来的偏差。

为了使估计的总体处理效应在期望上等于实验组的处理效应，我们需要引入以下两个假定：

Assumption 1： $\left(Y_{i}(0), Y_{i}(1)\right) \perp W_{i} | X_{i}$

Assumption 2: $0<\operatorname{Pr}\left(W_{i}=1 | X_{i}\right)<1$

第一个假定表明在控制了解释变量之后，实验组与控制组个体的选择与潜在因变量独立。第二个假定叫做重合假定，表明实验组与控制组应当在一个范围内都有观测值。这两个假定合起来称为“the strongly ignorable treatment assignment”假定。

如果以上两个假定成立，那么我们就可以选用回归、倾向得分匹配的方法。反之，则根据需要选用工具变量、DID、RD、HCW、合成控制法等。

除了假定以外，实验组分配机制也是决定我们能否使用因果推断以及使用哪种因果推断方法的重要因素。一般而言，我们都需要考虑实验组分配机制是否存在内部有效性和外部有效性的问题。内部有效性问题主要包含：1）未能完全随机分组；2）未能完全遵从实验设计；3）中途退出实验；4）观察效应或霍桑效应，即观察者会给实验者的行为造成扰动；5）样本量过小。内部有效性问题主要存在于实验设计本身，而外部有效性问题影响实验结果是否能够推广，具有参考价值和普遍的代表性，主要包括：1）样本代表性不足；2）小型实验的条件与大规模推广时的现实条件不同；3）一般均衡效应，以市场供需为例，市场在达到均衡与未达到均衡时供需机制显然是不同的；4）自我选择效应，以就业培训项目为例，选择进入就业培训项目的人往往在近几年收入较低，因此研究就业培训项目对收入的影响就会存在内生性问题。

因为文章比较长，所以我们这部分就先介绍RCM基本框架，接下来依次为大家介绍这一框架下不同的因果推断方法。

如何利用计量经济学的方法进行因果推断（一）

推荐阅读更多精彩内容