2022年7月4-22日举行的“[【招生啦!】2022年暑期“效傲江湖”:社会科学因果推断讲习班]开始报名啦!
本次讲习班将于2022年7月4-8号、18-22日两个时间段,在线上(腾讯会议或其它在线平台)分别举办4-5天的“社会科学因果推断讲习班”课程。两个阶段的课程主要包括三大块内容:(1)DID应用,旨在向学员们讲解虚拟变量DID、连续型DID估计量的最新进展,案例讲解及其stata操作,包括但不限于双向固定效应TWFE的偏误、偏误诊断方法、Bacon分解、Callaway and Sant’ Anna(2021)估计量、dChD(2018,2019,2020,2021,2022)估计量、Gardner(2021)估计量等;(2)面板事件研究的应用,旨在向学员们讲解事件研究的控制组选取、时变混淆因子的应对处理方式与经济含义、可视化等;(3)合成控制法的应用,旨在向学员们讲解单一处理组的合成控制法规定动作、少量多处理个体的合成控制法规定动作,包括最新的堆叠合成控制估计量、HL估计量及其统计量、处理前合成控制偏误诊断、处理后合成控制偏误纠正等;(4)其它应用性问题与技巧。欢迎大家参加我们的2022年暑期“社会科学因果推断讲习班”!
我们分时段、分学习阶段和分学习内容采取阶梯价格,例如,越远离开班日期、越是费用依靠父母或其它亲戚朋友的学生和研究者,收费越便宜。
更多报名优惠和详细课程大纲和招生信息参见(点击)[【招生啦!】2022年暑期“效傲江湖”:社会科学因果推断讲习班]!
正文
在【应用计量系列61】多政策效应评估:理论与应用中,我们简要介绍了Goldsmith-Pinkham, Hull, Kolesár (2022)的最新理论研究成果,即当存在下列情形时,OLS回不能识别出平均处理效应:
- 有多个相互排斥的处理/政策,即处理/政策A和B只能任选其一,例如学生要么进入小班,要么进入有助教的班级,又例如,戴美虹等(2021)研究的国企改革和采用信息化的四种战略组合,每家企业都只能采取其中的一种组合形式;
- 有控制变量;
- 处理效应在控制变量上有异质性。
如果存在上述情形,即使是随机实验数据,OLS回归不能识别出平均处理效应,OLS估计量存在偏误,Goldsmith-Pinkham, Hull, Kolesár (2022)将这个偏误称为“传染偏误”。
我们今天继续来看看“小班教学”和“助教”对学生成绩的影响。
一、实证结果回顾
更多的小班教学实验设计和研究设计细节,参见【应用计量系列61】多政策效应评估:理论与应用或者Stock and Watson(2019)的《计量经济学导论》第四版第十三章。
(一)小班教学和助教效应的OLS估计
* 加载数据
use "/Users/xuwenli/Library/CloudStorage/OneDrive-个人/DSGE建模及软件编程/教学大纲与讲稿/应用计量经济学讲稿/应用计量经济学讲稿与code/SW_4E_replication/stock_watson_4E_replication_chapter13/stock_watson_4E_replication_chapter13/star_sw.dta",replace
* 数据的统计描述
sum
* OLS回归
eststo: quietly reg tscorek sck rak i.black if stark==1,r //Kingdergarten样本的回归
eststo: quietly reg tscore1 sc1 ra1 i.black if star1==1,r //一年级样本的回归
eststo: quietly reg tscore2 sc2 ra2 i.black if star2==1,r //二年级样本的回归
eststo: quietly reg tscore3 sc3 ra3 i.black if star3==1,r //三年级样本的回归
esttab,se
回归结果如下表所示:
::: hljs-center
表1 小班和助教的OLS估计量
:::
年级 | ||||
---|---|---|---|---|
变量 | K | 1 | 2 | 3 |
small | 13.73*** | 25.88*** | 17.37*** | 13.61*** |
(2.418) | (2.694) | (2.553) | (2.290) | |
aide | 0.773 | 6.712** | 3.069 | 0.121 |
(2.228) | (2.481) | (2.347) | (2.145) | |
控制变量 | YES | YES | YES | YES |
样本量 | 5785 | 6377 | 6028 | 5956 |
注:括号中为标准误;* p<0.05, ** p<0.01, *** p<0.000。
表1的结果显示,在99%的置信水平下,小班教学可以提高学生的成绩,而助教对学生的成绩并没有显著的影响,除了一年级学生外,即对于一年级学生来说,助教也可以提高她们的成绩,这可能是因为一年级学生刚刚入学,对学校和学习都非常陌生,助教可以很好地引导这些刚入学的学生进入学习状态。
(二)多政策效应评估的stata命令与结果解读
我们还是使用上述小班教学和助教教学实验的数据(注:本文使用的数据来源与Goldsmith-Pinkham, Hull, Kolesár (2022)原文中的数据版本不一样,我们的数据来源于SW(2019)的教材第13章,所以结果与GPHK(2022)不一致)。
* 首先,生成一个分类处理变量,因为有三种班级类型,因此,我们定义分类处理变量为:正常班级为0,小班为1,有助教为2
g treatment=0
replace treatment=1 if sck==1
replace treatment=2 if rak==1
* 安装多处理/政策效应包multe
local github "https://raw.githubusercontent.com"
cap noi net uninstall multe
net install multe, from(`github'/gphk-metrics/stata-multe/main/)
* 分解结果和稳健估计量
multe tscorek treatment,control(black) decomp minmax
在估计“小班教学”和“助教”两个处理的效应时,我们仅仅关注Kingdergarter学生的成绩。也就是表1中的K列的样本。“小班教学”和“助教”两个处理的效应结果如表2所示。
::: hljs-center
表2 小班教学和助教效应的偏误与纠正估计量
:::
面板A:传染偏误分解 | ||||||
---|---|---|---|---|---|---|
变量 | OLS(1) | 自身效应(2) | 偏误(3) | 区间下界(4) | 区间上界(5) | |
small | 13.73*** | 13.73 *** | -0.003 | -0.003 | 0.003 | |
(2.42) | (2.42) | (0.01) | (0.01) | (0.01) | ||
aide | 0.77 | 0.79 | -0.014 | -0.014 | 0.014 | |
(2.23) | (2.23) | (0.03) | (0.03) | (0.03) | ||
面板B:处理效应纠正估计量 | ||||||
简单估计量(1) | 特定处理的方差加权估计量(2) | 可比有效加权估计量(3) | ||||
small | 13.76*** | 13.74*** | 13.75*** | |||
(2.42) | (2.42) | (2.42) | ||||
aide | 0.79 | 0.79 | 0.80 | |||
(2.23) | (2.23) | (2.23) |
注:括号中为标准误;* p<0.05, ** p<0.01, *** p<0.000。
表2中的Panel A第一列展示了Kindergarten的处理效应的OLS估计量。此时,结果变量为学生成绩,处理变量是“小班”和“助教”的二值型虚拟变量。我们可以看到,小班教学对学生成绩的效应为13.76,在95%置信水平下显著;有助教教学对学生的效应为0.77,在95%置信水平不显著。这与表1中OLS估计量一致。
Panel A第二列和第三列就应用Goldsmith-Pinkham, Hull, Kolesár (2022)提出的偏误分解方法将OLS估计量分解成处理/政策自身的效应和其它政策的传染偏误。从第三列结果来看,无论是“小班教学”,还是“助教教学”的效应偏误可能并不大。小班教学的OLS估计量13.73可以分解成小班自身的效应13.73和“助教”对小班教学效应的传染效应-0.0003,但是偏误在95%置信水平下不显著。类似地,助教对学生成绩的效应0.77可以分解成自身效应0.79和小班效应的传染偏误-0.014,但是,统计上并不显著。
于此同时,为了阐明传染偏误的潜在影响,我们还计算了估计量的偏误的最坏情形。即表2第4和5列显示了可能偏误的上下界相对于小班和助教的成绩效应估计量来说较小,小班效应偏误的上下界为[-0.0003,0.0003],助教效应偏误的上下界为[-0.014,0.014]。虽然,两个处理的偏误较小,但是Goldsmith-Pinkham, Hull, Kolesár (2022)在他们的例子中也指出,可能处理效应的异质性会放大传染性偏误。
为了应对可能的传染性偏误,Goldsmith-Pinkham, Hull, Kolesár (2022)给出了三种纠正估计量:
- 无加权(等权重)ATE,即最简化估计量(simple estimator),由Imbens and Wooldrige(2009)提出;
- 特定处理的方差加权ATE,由Angrist(1998)提出;
- 可比有效加权估计量,由Goldsmith-Pinkham, Hull, Kolesár (2022)提出。
结果如表2的panel B所示。这三个稳健估计量都表明,小班教学可以显著促进学生成绩,而助教对学生成绩的帮助不大。