在计量经济学研究中,双重差分法(Difference-in-Difference,DID)多用于公共政策或项目实施效果评估。近年来,双重差分法受到越来越多研究人员的青睐;本文将从双重差分法的原理、假设、模型说明以及案例讲解四方面进行介绍:
(一)原理
双重差分法普遍应用于政策效应评估研究。
例如研究 “ 京津冀协同发展 ” 、“ 高铁开通 ” 等政策实施带来的影响情况。
基本思想:
我们一般将使得自然环境发生改变的实验叫做自然实验。
双重差分法是一种比较成熟的进行政策研究的分析方法,其作用原理与自然实验相类似。它将某项政策的实施看作是一项自然实验,通过在样本中加入一组未受政策影响控制组,与原本受政策影响的样本点构成实验组进行比较分析,来考察政策实施对分析对象造成的净影响。
(二)假设
使用双重差分法进行政策效应评估,样本数据需要满足三个假设,分别是线性关系假设、个体处理稳定性假设、平行趋势假设。前两个假设一般都会满足,不需要单独进行验证,应该重点验证假设3。
假设1——线性关系假设
潜在结果变量同处理变量和时间变量满足线性条件。
假设2——个体处理稳定性假设
政策干预只影响实验组,不会对控制组产生交互影响。
假设3——平行趋势假设(最重要)
实验组和控制组在没有政策干预之前,二者的结果效应趋势应该是一样的(满足平行趋势)。
SPSSAU进行平行趋势检验的方法主要可分为以下几种:
以上检验方法将在下述案例讲解中进行演示说明。
(三)模型说明
双重差分法模型如下:
其中,i 代表个体,t 代表时间。Treat i 是分组虚拟变量,如果个体 i 属于实验组, 则Treat i =1;否则Treat i =0 。 After t 是分期虚拟变量,时间 t 在政策事件发生后,则 After t =1;否则 After t = 0;Treat i *After t为交互项,其系数β3即为双重差分模型重点考察的政策实施的净效应。
模型系数含义:
原理示意图:
(四)案例讲解
1、背景说明
研究经济示范区的设立是否会对地区经济增长产生影响(数据虚构,无实际意义)。
实验组为设立为高新区的B地区,控制组为与B地区除是否设立高新区这一因素外,其余发展条件相似的A地区。数字0为政策实施前,数字1为政策实施后。研究的效应项即被解释变量Y为 “ GDP ”,除此之外,还有3个控制变量(如:人口、对外投资、高校数量等会影响GDP的指标)。
2、数据格式
双重差分法的数据格式如下图所示,地区1表示实验组,地区0表示控制组;时间1表示政策实施后,时间0表示政策实施前。
3、SPSSAU操作
使用SPSSAU进行双重差分法操作如下,将指标分别拖拽到左侧对应分析框中:
4、输出结果解读
双重差分法得到的分析结果,需要重点关注的表格包括DID模型描述统计表、DID模型结果汇总表、t检验(Before)表、OLS回归分析结果表,分别说明如下:
- DID模型描述统计
上表格展示实验组、控制组,以及实验前后的样本分布情况。从上表可知,本案例实验组共有155个样本,控制组共有646个样本。双重差分法共4种组合,即实验组实验前、实验组实验后、控制组实验前、控制组实验后,每种组合一定要有数据才可以。
-
DID模型结果汇总
上表格展示DID模型最终结果。分别包括实验前(Before)和实验后(After)时,控制组或实验组的效应值水平。
效应值:效应值是一种量化指标,并非被解释变量从业人数的平均值(但通常接近于平均值),数学原理上其为ols回归的回归系数值。
表格解读:
①实验前Before状态时,实验组和控制组的差分效应量对应的t检验的p=0.556>0.05,没有呈现出显著性差异,即说明实验前,实验组和控制组的效应水平结果没有明显的差异性,即说明样本满足 ‘平行趋势假设 ’。
②实验后After状态时,实验组和控制组的差分效应量对应t检验的p=0.024<0.05,呈现出显著性差异,即说明在实验后,实验组的效应值明显高于控制组效应值。
③Diff-in-Diff,即最终的双重差分值,上表格时,双重差分效应值为2.935且对应t检验的p=0.045<0.05,呈现出显著性差异,即说明双重差分效应显著,说明 “ 高新区的设立 ” 有助于 “ 地区经济增长 ”,提高的平均效应水平为2.935。
t检验(Before)(平行趋势检验)
上表格展示t检验法进行“ 平行趋势检验 ”:针对实验前数据进行t检验,可以看出,实验组和控制组并没有呈现出显著性差异(p=0.978>0.05),说明在实验前,实验组和控制组的GDP并没有明显的差异性,即样本满足平行趋势假设(通常仅关注被解释变量Y的差异性)。
补充:平行趋势检验的其他方法
-
交互项显著性检验法
① 将时间项做哑变量处理 【生成变量->虚拟(哑)变量】
② 将时间_实验前与地区作交互项得到Product_2项 【生成变量->乘积(交互项)】
③ 交互项与被解释变量Y做线性回归,判断交互项显著性。
从上表可以看出,交互项Product_2项对应p=0.957>0.05,没有呈现出显著性,说明样本数据满足平行趋势假设。
-
F检验法
与交互项显著性检验法检验过程一样,最后查看F统计量显著性。
从上表可以看出,F统计量对应p=0.957>0.1(一般以p>0.1作为标准),没有呈现出显著性,说明样本数据满足平行趋势假设。
-
图示法
使用SPSSAU簇状图完成,横坐标为时间,纵坐标为被解释变量Y:
从上图可以看出,实验前实验组和控制组的GDP效应水平基本一致,因此样本数据满足平行趋势假设。
-
OLS回归分析结果
上表格展示OLS回归分析结果,其为双重差分模型的数学原理。
如上表格中 “ 地区*时间 ” 这一交互项的回归系数值2.935即为 “ DID模型结果汇总 ”表格中的Diff-in-Diff效应值。
其他说明
双重差分法的模型和原理相比其他方法来讲比较容易理解和运用,同时其能够很大程度地避免内生性问题,即有效控制被解释变量和解释变量之间的相互影响效应,这两点主要原因使得双重差分法近年来被广泛应用。
但是双重差分法也有其局限性。比如双重差分法主要适用于面板数据,如果只是截面数据,就不适合使用该方法;再者在实际研究中,很可能找不到合适的控制组来进行比较,那么研究者很可能根据主观判断选取控制组,导致研究不够严谨。所以在实际研究中,一定要关注双重差分法使用的前提假设等。如果确实不适合使用双重差分法,可以选择其他方法进行分析,比如PSM-DID、合成控制法等等。
案例数据请查看帮助手册:https://spssau.com/helps/conometricstudy/did.html