如何利用计量经济学的方法进行因果推断(一)

本文是在我在这学期听了北京大学国发院2019年春季学期沈艳老师开设的《高级计量经济学2》后对因果推断部分的总结,主要涉及DID、RD、倾向得分匹配、HCW及合成控制法等计量方法。

因为文章包含了很多我个人的理解,免不了有所疏漏或者有理解不到位之处,还请大家批评指正。大家如果有兴趣对因果推断的方法进一步探究,可以阅读我在文章最下方列出的课程参考文献以及我自己认为对理解因果推断很有帮助的一些文章。



首先,什么是因果推断?我认为因果推断是用已有的证据去证明两件事、两个变量之间的因果联系,比如证明教育年限对于工资水平的影响,或者是气候变化对于农作物产量的影响,这里的教育年限和气候变化就是因,而工资水平和农作物产量则是果。

用于验证因果关系最理想的办法,自然是做实验。继续上文教育年限和工资水平的例子,我们如果想证明教育年限对于工资水平有影响,在理想状态下应该找一群人,控制他们的性别、年龄、智商等等所以可能影响工资水平的因素不变化,而只让教育年限发生变化,来观察工资水平是否会发生变化以及发生多大的变化。但现实中,尤其是对于社会学科来说,通常的研究对象是人,很难像自然科学一样在可以对各变量进行严格控制的环境下进行实验,所以就又有了下面我们要讲的方法。

第一种是随机控制实验(random control trial),也就是近些年比较火的RCT方法。用药品测试作为例子,为了测试某种新药到底有没有效果,药品公司招募了一批符合条件的被试者,将这些被试者随机分入控制组或者实验组。控制组仅发放安慰剂,而实验组则会发放真正的药品,但是被试者并不知道发放到自己手中的药品究竟是安慰剂还是开发的新药。在实验结束以后,对比实验组与控制组的相应身体指标,二者之间的平均差异就是新药的效果。

第二种是自然实验(natural experiment)或者准实验(quasi-experiment)。这类实验主要是指由于某些外部突发事件,使得当事人仿佛随机地被分配到了实验组和控制组,因而可以进行比较,探究是否存在因果关系。通过个体分组是否完全取决于这一突发事件,我们又可以进一步将其分为两类实验:第一类个体分组完全取决于突发事件,比如1992年,美国新泽西州通过法律将最低工资从每小时4.25美元提高到5.05美元,但在相邻的宾夕法尼亚州最低工资依然保持不变,这两个州的雇主仿佛被随机地分配到实验组(新泽西州)与控制组(宾夕法尼亚州)。这类自然实验可以直接用OLS估计因果效应。第二类个体分组只是部分地由自然实验所决定,如Angrist(1990) 考察越战期间的参军者,当时美国对全国年轻男子以生日抽签的方式进行征兵,尽管抽签完全随机,但是否参军取决于体检,且有些人得到豁免,另一些人未抽中却自愿参军,此时应以自然实验所带来的随机变动作为工具变量。

那在介绍完以上的实验之后,我们正式进入因果推断的框架。我们这里主要用到的是RCM的模型,即Rubin Causal Model (RCM; Rubin 1978)。首先我们引入潜在因变量的概念。

什么叫做潜在因变量呢?例如一个人上了大学,我们想研究上大学这一事件对于他的收入带来了多大的提升,这一提升叫做上大学这一事件的处理效应。为了计算这一处理效应,我们就要对这个人上了大学的收入和没上大学的收入两者相减。但在实际情况中,我们只能观察到他上了大学的收入,而无法观察到他没上大学的话收入是多少,因为一个人无法像薛定谔的猫一样同时兼具两种状态,要么是生,要么是死,一旦一种状态被确定,另一种状态下发生的事情就无法观测到了。此时,这个无法观测到的因变量就叫做潜在因变量。那我们引入以下的一些notation。

接下来我们就要定义所谓的处理效应。因为总体可以分为实验组和控制组,相应在总体、实验组和控制组三个层面上就有三种处理效应。用我们上面提到的总体处理效应是指总体随机分配个体到实验组与控制组所得到的处理效应,即\tau_{P}=E\left[Y_{i}(1)-Y_{i}(0)\right]。而实验组处理效应为\tau_{P T}=E\left[Y_{i}(1)-Y_{i}(0) | W=1\right]。控制组的处理效应为\tau_{U T}=E\left[Y_{i}(1)-Y_{i}(0) | W=0\right]。这三者之间的关系是\tau_{P}=\operatorname{Pr}(W=1) \tau_{P T}+\operatorname{Pr}(W=0) \tau_{U T},即总体处理效应是实验组处理效应与控制组处理效应的权重加总。

在现实中由于潜在因变量的问题,我们往往无法估计以上三种处理效应。我们往往通过比较实验组与处理组的平均差异来近似个体处理效应,即:

\frac{1}{N_{T}} \sum_{i : W_{i}=1}^{N} Y_{i}-\frac{1}{N-N_{T}} \sum_{i : W_{i}=0}^{N} Y_{i}

N \text { and } N_{T}趋于无穷时,该值依概率收敛于E\left(Y_{i} | W_{i}=1\right)-E\left(Y_{i} | W_{i}=0\right),经过一番操作后可以化为

\begin{array}{l}{\left\{E\left[m_{1}(X)-m_{0}(X) | W=1\right]\right\}}  {+\left\{E\left(m_{0}(X) | W=1\right)-E\left(m_{0}(X) | W=0\right)\right\}}  {+\{E[\varepsilon(1) | W=1]-E[\varepsilon(0) | W=0]\}}\end{array}

第一个花括号内即为实验组的处理效应,第二个花括号内是由实验组和控制组解释变量差异带来的混淆效应,即实验组和控制组个体本身的异质性,第三个花括号内是实验组和控制组个体不可观测因素带来的偏差。

为了使估计的总体处理效应在期望上等于实验组的处理效应,我们需要引入以下两个假定:

Assumption 1:\left(Y_{i}(0), Y_{i}(1)\right) \perp W_{i} | X_{i}

Assumption 2:0<\operatorname{Pr}\left(W_{i}=1 | X_{i}\right)<1

第一个假定表明在控制了解释变量之后,实验组与控制组个体的选择与潜在因变量独立。第二个假定叫做重合假定,表明实验组与控制组应当在一个范围内都有观测值。这两个假定合起来称为“the strongly ignorable treatment assignment”假定。

如果以上两个假定成立,那么我们就可以选用回归、倾向得分匹配的方法。反之,则根据需要选用工具变量、DID、RD、HCW、合成控制法等。

除了假定以外,实验组分配机制也是决定我们能否使用因果推断以及使用哪种因果推断方法的重要因素。一般而言,我们都需要考虑实验组分配机制是否存在内部有效性和外部有效性的问题。内部有效性问题主要包含:1)未能完全随机分组;2)未能完全遵从实验设计;3)中途退出实验;4)观察效应或霍桑效应,即观察者会给实验者的行为造成扰动;5)样本量过小。内部有效性问题主要存在于实验设计本身,而外部有效性问题影响实验结果是否能够推广,具有参考价值和普遍的代表性,主要包括:1)样本代表性不足;2)小型实验的条件与大规模推广时的现实条件不同;3)一般均衡效应,以市场供需为例,市场在达到均衡与未达到均衡时供需机制显然是不同的;4)自我选择效应,以就业培训项目为例,选择进入就业培训项目的人往往在近几年收入较低,因此研究就业培训项目对收入的影响就会存在内生性问题。

因为文章比较长,所以我们这部分就先介绍RCM基本框架,接下来依次为大家介绍这一框架下不同的因果推断方法。



相关网页:

Rubin Causal Model (RCM) 和随机化试验(作者写的一系列关于因果推断的文章可读性很不错,大家有兴趣可以一览)

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,332评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,508评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,812评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,607评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,728评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,919评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,071评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,802评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,256评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,576评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,712评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,389评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,032评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,798评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,026评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,473评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,606评论 2 350

推荐阅读更多精彩内容