【应用计量系列101】Stata 18新功能:异质性处理效应

STATA 18已经发布,对我来说,最重要的更新之一是“异质性处理效应”。即但处理效应在时间维度和组群(类)维度存在异质性时,传统的TWFE估计量难以理解,甚至会产生严重的偏误。这些知识,我们已经讲过很多遍了。再次提醒注意,异质性处理效应不仅仅出现在时间维度,也不仅仅只是出现在交叠处理情形。最新进展概述参考DID最新进展

STATA 18更新了两个命令xthdidregresshdidregress,它们分别针对面板数据和重复截面数据来估计异质性处理效应下的ATT,或动态处理效应。它们都是基于Callaway and Sant' Anna(2021)Wooldridge(2021)的异质性处理效应稳健估计量。所以更加适用于交叠处理情形下,时间维度和类维度异质性处理效应的估计。对于CS估计量,stata 18内置了三种协变量调整方法:回归调整(RA)、逆概率加权(IPW)和扩展的逆概率加权(AIPW)。这与Fernando开发的csdid和csdid2相比,还是少了很多方法,而且在其他的方面,csdid也更出色一些,因此,在实践中,我还是建议使用csdid这个包。对于Wooldridge(2021)的估计量来说,就是扩展的TWFE估计量,更详细的介绍请参考我以前的笔记。目前的DID应用研究中,大多数使用csdid,目前还没使用jwdid的,请参考【DID最新应用文献解读】

下面,我们来介绍一些CS估计量:

一、模型

xthdidregress命令用DID估计处理效应:(1)多时期;(2)交叠处理(不同处理时点);(3)处理效应在时间和类间存在异质性。

观测数据\{y_{it},x_{it},d_{it},z_{it}\},其中,y_{it}是观测的结果变量,x_{it}是结果模型的协变量,d_{it}是而执行处理变量,z_{it}是处理配置的协变量。

定义y_{it}(g)表示如果初次处理发生在时期g,个体i在时间t的潜在结果。y_{it}(0)表示从而处理的潜在结果。所有个体都可以划分为类(cohorts),每一类集聚了相同处理时点的个体。例如,类g意味着,所有的个体处理发生在g期。g类的个体可以表示为G_{ig}=1。当个体i从未处理,我们用G_{i0}=1表示。因此,类0表示那些从未接受处理的个体。假设一旦处理,就不会退出处理。

为了显示异质性处理效应在类和时间上如何演化,我们对每一类和时间的结合的ATT比较感兴趣。定义\theta(g,t)表示g类t期的ATT,即
\theta(g,t)=E\{y_t(g)-y_t(0) | G_g=1\}

其中,如果个体属于类g,那么,G_g=1

CS估计量:
为了定义处理效应,我们需要控制组。有两种方式可以定义控制组:第一,从未处理的个体作为控制组。如果个体属于从未处理,那么C^{NEW}=1。尤其是,C^{NEW}=G_0。第二,让不在类g中,且t期还未接受处理的个体作为控制组(notyet)。如果个体在t期属于还未处理个体,那么C_{gt}^{NY}=1。尤其是,C_{gt}^{NY}=(1-G_g)(1-d_t)。为了简化,我们将控制组表示为C_{gt}^*

那么,① 回归调整的估计量(RA):
\theta_{RA}(g,t)=E[\frac{G_g}{E(G_g)}(y_t-y_{g-1}-m_{gt}(x))]
其中,m_{gt}(x)=E(y_t-y_{g-1} | x,C_{gt}^*=1)

② IPW估计量:
\theta_{IPW}(g,t)=E([\frac{G_g}{E(G_g)}-\frac{\frac{p_{gt}( z)C_{gt}^*}{1-p_{gt}( z)}}{E(\frac{p_{gt}( z)C_{gt}^*}{1-p_{gt}( z)})}](y_t-y_{g-1}))
其中,p_{gt}( z)=Pr(G_g=1 |z,G_g+C_{gt}^*=1)

③ AIPW估计量:
\theta_{AIPW}(g,t)=E([\frac{G_g}{E(G_g)}-\frac{\frac{p_{gt}( z)C_{gt}^*}{1-p_{gt}( z)}}{E(\frac{p_{gt}( z)C_{gt}^*}{1-p_{gt}( z)})}](y_t-y_{g-1}-m_{gt}(x)))

Callaway and Sant' Anna(2021)显示:
\theta(g,t)=\theta_{RA}(g,t)=\theta_{IPW}(g,t)=\theta_{AIPW}(g,t)
我们可以使用观测数据来估计后面三种估计量。

处理效应的识别可以分成三步:

  • 1、将样本现在在t期和t_0期,留下类g的个体或控制组C_{gt}^*中的个体,且如果t\ge gt_0=g-1,或者t < gt_0=t-1。仅仅只是用配对观测值。换言之,如果个体i在t期和t_0期都观测到,个体i的样本才被使用。
  • 2、用参数模型来估计隐函数p_{gt}( z)、m_{gt}(x)。实践中,用线性回归模型来拟合m_{gt}(x),用logit模型来拟合p_{gt}( z)。尤其是,
  • a. 当C_{gt}^*=1时,用y_t-y_{t_0}对x回归;
  • b. 线性预测值为m_{gt}(x)
  • c. 用G_g对z跑logit回归;
  • d. 正结果的概率预测值为p_{gt}( z)
  • 3、将估计得到的p_{gt}( z)、m_{gt}(x)带入三种估计量中。注意,期望算子被样本均值替换。

估计量的方差-协方差矩阵用影响函数方法计算。影响函数法在数值上等价于GMM方法。然后它更快。

Wooldridge(2021)的估计量的技术细节参见Wooldridge(2021)

我们用Stata 18提供的一套模拟数据来看看内置的异质性处理效应稳健估计量的用法和stata命令格式。

二、忠犬八公的故事

《忠犬八公的故事》是一部非常感人的美国电影。讲述的是,教授帕克(理查·基尔 Richard Gere 饰)在小镇的火车站拣到一只走失的小狗,冥冥中似乎注定小狗和帕克教授有着某种缘分,帕克一抱起这只小狗就再也放不下来,最终,帕克对小狗八公的疼爱感化了起初极力反对养狗的妻子卡特(琼·艾伦 Joan Allen 饰)。八公在帕克的呵护下慢慢长大,帕克上班时八公会一直把他送到车站,下班时八公也会早早便爬在车站等候,八公的忠诚让小镇的人家对它更加疼爱。有一天,八公在帕克要上班时表现异常,居然玩起了以往从来不会的捡球游戏,八公的表现让帕克非常满意,可是就是在那天,帕克因病去世。帕克的妻子、女儿安迪(萨拉·罗默尔 Sarah Roemer 饰)及女婿迈克尔(罗比·萨布莱特 Robbie Sublett 饰)怀着无比沉痛的心情埋葬了帕克,可是不明就里的八公却依然每天傍晚五点准时守候在小站的门前,等待着主人归来……本片根据上个世纪30年代发生在日本的真实故事改编。最近,中国也改编了这部电影,上映了中国版《忠犬八公》。

image.png

我们除了感动于狗狗的忠诚外,还对另一个现实的问题感兴趣,那就是:电影里以狗狗作为主人公会不会促进人们养狗?

Ghirlanda, Acerbi,and Herzog (2014)研究了这个问题。Stata 18用了一套模拟数据,有141条养狗记录,时间跨度2021-2040。在样本初期,没有电影里出现养狗。2034年,电影出现养狗,接下来是2036,2037。

 use https://www.stata-press.com/data/r18/akc

tabulate year movie

sum

xtset breed year
image.png

异质性处理效应估计量的命令格式:

* TWFE
xthdidregress twfe (ovar omvarlist) (tvar) [if]   [in]   [weight], group(groupvar) [options]

*Regression adjustment
xthdidregress ra (ovar omvarlist) (tvar) [if]   [in]   [weight], group(groupvar) [options]

*Inverse-probability weighting
xthdidregress ipw (ovar) (tvar tmvarlist) [if]   [in ] [weight], group(groupvar) [options]

* Augmented inverse-probability weighting
xthdidregress aipw (ovar omvarlist) (tvar tmvarlist) [if]   [in]   [weight], group(groupvar) [options] 

*其中,ovar是结果变量,omvarlist是结果模型中的协变量,tmvarlist是处理变量模型中的协变量,groupvar是类变量,即同一处理时点的组群类别。

在模拟数据集中,registered是结果变量,观测层面的处理变量movie,组群变量定义在处理发生的层面,也识别聚类变量breed,best是结果模型的协变量。我们使用CS(2021)回归调整估计量:

xthdidregress ra (registered best) (movie), group(breed)

*每个处理类一个图
estat atetplot
image.png

还可以获得按类、按时间获得总的ATT:

* 按类
estat aggregation, cohort

*按时间
estat aggregation, time

image.png

image.png

还可以把上述时间的ATT以图的方式呈现:


image.png

还可以呈现事件研究图结果:

*事件研究

estat aggregation, dynamic graph
image.png

使用Wooldridge(2021)的估计量:

* Wooldridge估计量
xthdidregress twfe (registered best) (movie), group(breed)
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容