参考:
https://zhuanlan.zhihu.com/p/103412389
【计量地图】DID(双重差分)学习框架和实践 - 知乎 (zhihu.com)
https://zhuanlan.zhihu.com/p/102428197
Stata: 多期倍分法 (DID) 详解及其图示 - 知乎 (zhihu.com)
推荐阅读的优秀文献
【1】郑新业, 王晗, 赵益卓. "省直管县"能促进经济增长吗?——双重差分方法[J]. 管理世界, 2011, 000(008):34-44.
【2】陈思霞, 卢盛峰. 分权增加了民生性财政支出吗?——来自中国"省直管县"的自然实验[J]. 经济学(季刊), 2014, 13(4).
【3】汪伟,艾春荣,曹晖.税费改革对农村居民消费的影响研究[J].管理世界,2013(01):89-100.
【4】叶青,李增泉,李光青.富豪榜会影响企业会计信息质量吗?——基于政治成本视角的考察[J].管理世界,2012(01):104-120.
【5】余明桂,李文贵,潘红波.民营化、产权保护与企业风险承担[J].经济研究, 2013, 48(09): 112-124.
【6】肖浩,孔爱国.融资融券对股价特质性波动的影响机理研究:基于双重差分模型的检验[J].管理世界,2014(08):30-43+187-188.
【7】洪俊杰,刘志强,黄薇.区域振兴战略与中国工业空间结构变动——对中国工业企业调查数据的实证分析[J].经济研究,2014,49(08):28-40.
【8】李志生,陈晨,林秉旋.卖空机制提高了中国股票市场的定价效率吗?——基于自然实验的证据[J].经济研究,2015,50(04):165-177.
模型介绍
假设现要修一条铁路,其必然会有穿过的和没有穿过的城市。现在我们想知道铁路修好以后,被铁路穿过的城市经济增长是不是更快了?为了加深大家理解,画了一个拙劣的图,橘色代表铁路穿过的一个或者一类城市(统称A城市),蓝色代表的是铁路没有穿过的的城市(统称B城市)。效果图如下:
关于这个问题,有两个解决思路:
(1)简单粗暴的。直接用A城市的GDP平均值与B城市的GDP平均值相减,
但是,这个减法忽略了城市的自有禀赋问题,万一A城市的资源禀赋比较好,GDP本来就高,凭什么一定要说成是政策造成的呢?
(2)复杂一点的方法。我们重新考虑时间的动态变化(政策带来的效应),考虑个体差异。于是便有了双重差分。
2.何为双重差分(DID)?
2.1 从公式来看DID
所谓差分,简单理解,就是做减法。而双重差分,就是做两次减法。为什么要做两次减法,就是为了解决如何把两个城市放在同一起跑线上,再去检验政策对其是否有效果。具体思路是:
通过观察至少两期的数据:
①第一期:修铁路前
②第二期:写铁路后
这是第一次差分,聚焦于t=0到t=1两个时刻间,个体i,即每个城市GDP的增长,也可以看成GDP的趋势
第二步:时间差异(政策差异)
这是第二次差分,这一步就把两类城市在修建铁路之前和之后的GDP增长率的差异给算出来了,这就是我们要的处理效应,即修建铁路之后对城市经济的促进作用。记T=1 如果时间为建铁路之后,T=0如果时间为建铁路之前,那么我们可以得到一个表:
这个式子的回归,得到的交叉项的系数就是所要估计的处理效应,用一个图表示就是:
DID最关键的假设是common trend,也就是两个组别在不处理的情况下,y的趋势是一样的。那么你会说了,铁路穿过的城市可能本身GDP也高,而GDP高的城市按照理论GDP增长率可能更高可能更低,所以common trend的假设可能是不对的,那怎么办?如果这个问题存在,我们可以进一步假设在控制了某些外生变量之后,common trend是对的,比如上个问题,我们可以控制城市在t=0期的GDP level。当我们控制其他变量之后,自然不能直接减两次了,我们需要用上面说的回归式子,即run the following OLS:
适用条件
并不是所有政策评估都适合DID
1.数据结构要求
(1)政策不能是“一刀切”类型,即存在受政策影响的实验组和不受政策影响的对照组
(2)至少两年的面板数据,如果是截面数据一般也别考虑了
2.模型要求
(1)平行趋势(CT)假设。简单来说,政策实施前,处理组和控制组其他禀赋条件都差不多。(PS:一般,常用倾向得分匹配法PSM可以得到实现)。处理组和对照组有共同趋势,在政策干预之前,处理组和控制组的结果效应的趋势应该是一样的。
(2)SUTVA条件。政策干预只影响处理组,不会对控制组产生交互影响。政策干预只影响处理组,不会对控制组产生交互影响,或者政策干预不会产生外溢效应;
(3)线性形式条件。潜在结果变量同处理变量和时间变量满足线性条件。
由此可见DID的使用条件较为严苛,并不能随意使用。
模型构造
稳健性检验
1.共同趋势(CT)检验
(1)画图。
画出实验组时期和对照组时期的时间趋势图;弱两条线走势完全一样或者基本一致,则满足共同趋势(CT)假设。
(2)回归。
1)操作:dt项目→改为“年份虚拟变量”,a年即有a个虚拟变量。交互项代表政策实施前,实验组和对照组的差异
2)解读:若a个交互项不显著,则说明政策实施前实验组和对照组不存在明显差别;放松的CT检验认为,只要a个交互项联合不显著,也可以满足假设。
2.安慰剂检验
2.1 看不一致
1)选择政策实施前年份进行处理。
eg.假设2013-2015年是研究区间,2014年是政策发生实践。
则可以移动区间把2011-2013年设置为样本区间,并假设政策发生在2012年,进行回归。
在这样的虚构模型假设下,如果回归结果仍然显著,则可能原来的结果存在偏误。
2)选择已知的不受政策影响的群体作为处理组进行回归。
3)选择一个完全不受政策敢于影响的因素作为解释变量进行回归。
1)、2)、3)这三种情况下,如果原来的结果稳健的话,虚构模型下的结果都不应该显著。如果显著,就回过头去检查之前的模型和结果是否有问题。
所以,这里,跟我们常见稳健性检验有点差异。
2.2 看一致
利用不同的对照组进行回归,看结论是否一致。