固定效应在哪个层级？

用固定效应（FE）来估计面板数据模型是经济学和其它学科经验研究最常用的方法。固定效应估计量消除了个体层面的异质性。包括时间固定效应可以解释影响所有个体的长期宏观冲击。消除个体和时间固定效应会得到更加可信的政策分析结论，尤其是当干预在处理组群与时间上有异质性效应时（Wooldridge，2021）。

众所周知，固定效应估计量所使用的组内转换可以消除核心解释变量的许多变动，这会导致不精确的FE估计量。例如，我们发现了碳排放权交易对能源结构转型有特别重要的效应，但置信区间可能太宽，从而不显著。在这种情形下，人们也可以使用随机效应（RE）估计量——对异质性误差施加一下二阶矩假设得到的广义最小二乘估计量。RE估计量通常比FE更精确，但是，在解释变量与个体不可观测的异质性特征相关时，RE估计是非一致性的。那么，在FE和RE之间选择时，其实就是检验解释变量是否与不可观测的异质性特征相关。

Hausman（1978）检验是一种常用的方式。但是Wooldridge（2010，2019）指出，在序列相关和异方差稳健情形下，常常使用的是传统的、非稳健的Hausman检验。扩展Mundlak（1978）方法，Wooldridge（2019）提出了一种更加稳健的Hausman检验方法。Yang and Schmidt（2021）提出了一种基于回归的Hausman检验来比较Hausman-Taylor（1981）估计量和FE估计量。YS仍然假设时变解释变量与不可观测个体异质性特征不相关。

我们可以不用选择FE和RE估计量，从而得到更加精确的处理效应估计量。Papke and Wooldridge（2022）（“A Simple, Robust Test for Choosing the Level of Fixed Effects in Linear Panel Data Models”）提出了一种思路来recover固定效应消除的时变解释变量的变动：在更高层级上消除不可观测异质性特征足矣。例如，我们有企业层面的面板数据，真正的FE估计量消除了企业层面的时间平均值。但是如果我们认为企业属于行业层面，我们可以思考一下消除行业层面的异质性特征足以确保解释变量的外生性。或者在学校层面的面板数据中，消除学区层面的异质性特征足矣。这也就意味着，我们控制更高层级的固定效应即可。

当更高层级的组群数量较小时，仅仅包括组群虚拟变量，然后估计随机效应方程。人们可以使用Wooldridge（2019）提出的VAT版本Hausman检验，即解释变量的时间均值包含在POLS或者RE估计中。例如，我们有中国家庭追踪调查微观数据，包括30个内地省级地区的虚拟变量并不会带来什么新问题。

但是，当更高层级的组群数量很大时，我们就需要保持谨慎。例如，如果我们知道家庭追踪调查的每个家庭的县级代码，那么，我们国家有几千个区县。这个时候，我们更关心的问题是，我们要控制地区层面的固定效应，还是应该控制家庭层面的固定效应？

Papke and Wooldridge（2022）提出了一个易于实施的算法来检验固定效应的层级，即稳健地检验是控制更高层面的固定效应，还是个体层面的固定效应？

步骤：

① 构建解释变量在时间层面的个体均值， $\overline{x}_i$ ；
② 用组群g层面的固定效应估计下列方程：
$y_{it}=d_t \alpha +x_{it} \beta + z_i \gamma +\overline{x}_i \xi +h_{g(i)}+e_{it}$
③ 用组群g的固定效应估计
$y_{it}=\eta+d_t \alpha +x_{it} \beta + z_i \gamma +\overline{x}_i \xi +h_{g(i)}+a_i+u_{it}$
并用稳健Wald检验（聚类在个体层面或者组群层面）来检验
$H_0: \xi=0$

这有什么实践含义呢？

第一，我们知道，获得处理效应一致估计量最稳健的分析是控制个体层面的固定效应。因此，如果个体层面的固定效应估计量足够精确，人们完全可以不用Papke and Wooldridge（2022）的方法。PW的检验方法适用于个体层面的固定效应可能非常不精确（例如，置信区间很大，不显著），以至于我们得不到什么具体的结论。这个时候就可以使用PW的方法来考虑一下使用更高层级的固定效应是否足够。

第二，如果核心解释变量 $x_{it}$ 还包括一些复杂的函数形式，例如，二次项或交互项，亦或者与时间虚拟变量的交乘项，那么，时间层面的均值都会出现在 $\overline{x}_i$ 中。如果核心解释变量是二值型政策变量，或者一个时间不变的变量与时变变量交乘。上述方法仍然适用。

例子

Papke(2005)用1995年美国密西根如何资助学校的政策（学校支出政策）对4年级数学成绩的影响。原文使用的是IV方法，PW（2022）关心的问题是用学区层面的固定效应，而不是学校层面的固定效应，是否能估计出学校支出的效应？

* 加载数据
use "/Users/xuwenli/Library/CloudStorage/OneDrive-个人/DSGE建模及软件编程/教学大纲与讲稿/应用计量经济学讲稿/应用计量经济学讲稿与code/fixed_effects_level/meap94_98.dta", clear

sum

image.png

其中，math4是结果变量（4年级学生获得满意成绩的比例）。

xtset schid year
tab year

image.png

数据集分布在1994-1998年间，是一个非平衡面板，在1994-1995年，许多学校都没有报告生均支出。解释变量是lavgrexp（当年和上一学年实际生均支出均值的对数）。这个数据缺失的原因可能与学校层面的异质性特征有关，或者与学区层面异质性特征有关。学校的资助是学区层面决定的，然后学区将资金分配给学校。可能所有的资金分配过程都不是随机的，且与学校的特征有关系。

有两个控制变量，lunch(有资格获得联邦免费午餐的学生比例)、lenrol（入学数量的对数）。回归方程包括所有的时间虚拟变量。

* 传统的TWFE with 学校固定效应：学校聚类和学区聚类
xtreg math4 lavgrexp lunch lenrol i.year, fe vce(cluster schid)
xtreg math4 lavgrexp lunch lenrol i.year, fe vce(cluster distid)

image.png

* 学区固定效应
xtset distid

xtreg math4 lavgrexp lunch lenrol i.year, fe vce(cluster distid)

image.png

从上面的结果可以看出，学校支出政策对学校数学成绩的影响，在控制学校固定效应后，系数为6.288，95%置信水平下显著。而控制了更高层级固定效应（学区固定效应）后，系数变为-0.615，且在95%置信水平下不显著。

在来看看lunch的系数，也就是学校学生贫困率的近似指标。在控制学区固定效应后，lunch的系数为-0.312，在95%的置信水平下显著，即学生贫困率提升10%，数学成绩会下降3.1%。但是，当控制学校固定效应后，lunch的系数下降到-0.022，且在95%的置信水平下不显著。学校固定效应和学区固定效应下的lunch系数差异意味着，lunch在学校层面的变动非常重要。

接下来，我们可以利用PW的方法检验学区固定效应和学校固定效应。即

首先，计算解释变量的时间均值；
然后，包含均值跑TWFE回归；
用Wald检验H0；

* lavgrexpb lunchb lenrolb为解释变量均值
xtset distid
xtreg math4 lavgrexp lunch lenrol i.year lavgrexpb lunchb lenrolb ///
    y95b y96b y97b y98b , fe vce(cluster distid)

* 检验H0
test lavgrexpb lunchb lenrolb y95b y96b y97b y98b

image.png

结果显示，学区固定效应的F统计量F=13.87，p值为0，因此，拒绝学区层面固定效应，学校层面的固定效应更好。

另一种检验固定效应层级的方法：

* 稳健Hausman检验
* Reproduce the clustered standard errors for the schid-level FE estimator:
xtset schid
qui xtreg math4 lunch lenrol i.year, fe
predict ydd, e
qui xtreg math4 lavgrexp lunch lenrol i.year, fe
scalar b_lavgrexp_schid = _b[lavgrexp]
predict uddh, e
qui xtreg lavgrexp lunch lenrol i.year, fe
predict wdd, e
gen wddsq = wdd^2
sum wddsq
scalar addh = r(mean)
gen rddh = wdd*uddh/addh
reg rddh, vce(cluster schid)
reg rddh, vce(cluster distid)
* Confirm estimate of b_lavgrexp using Frisch-Waugh:
reg ydd wdd, vce(cluster schid)
reg ydd wdd, vce(cluster distid) 

* Now with district-level FEs:

xtset distid
qui xtreg math4 lunch lenrol i.year, fe
predict yd, e
qui xtreg math4 lavgrexp lunch lenrol i.year, fe
scalar b_lavgrexp_distid = _b[lavgrexp]
predict udh, e
qui xtreg lavgrexp lunch lenrol i.year, fe
predict wd, e
gen wdsq = wd^2
sum wdsq
scalar adh = r(mean)
gen rdh = wd*udh/adh
reg rdh, vce(cluster schid)
reg rdh, vce(cluster distid)
* Confirm estimate of b_lavgrexp using Frisch-Waugh:
reg yd wd, vce(cluster schid)
reg yd wd, vce(cluster distid) 

* Now obtain standard error for the difference in estimators of b_lavgrexp:
gen eh = rddh - rdh
reg eh, vce(cluster schid)
scalar se_schid = _se[_cons]
reg eh, vce(cluster distid)
scalar se_distid = _se[_cons]

* Construct the robust Hausman statistic:
scalar t_schid = (b_lavgrexp_schid - b_lavgrexp_distid)/se_schid
di t_schid
di 2*(1 - normal(abs(t_schid)))
scalar t_distid = (b_lavgrexp_schid - b_lavgrexp_distid)/se_distid
di t_distid
di 2*(1 - normal(abs(t_distid)))

image.png

上述结果显示，tH统计量为2.68，p值为0.007。这意味着在95%置信水平下强烈拒绝学区固定效应。

在PW文章的例子后面，作者还根据所研究问题的经济制度讨论了如何考虑固定效应层面问题。我读完这篇文章后的第一感觉是，选择固定效应层级，仍然要结合所研究问题的经济制度背景来讨论，然后在结合PW提出的定量检验方法。

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 212,185评论 6赞 493
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 90,445评论 3赞 385
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 157,684评论 0赞 348
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 56,564评论 1赞 284
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 65,681评论 6赞 386
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 49,874评论 1赞 290
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 39,025评论 3赞 408
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 37,761评论 0赞 268
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 44,217评论 1赞 303
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 36,545评论 2赞 327
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 38,694评论 1赞 341
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 34,351评论 4赞 332
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 39,988评论 3赞 315
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 30,778评论 0赞 21
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 32,007评论 1赞 266
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 46,427评论 2赞 360
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 43,580评论 2赞 349

固定效应在哪个层级？

例子

推荐阅读更多精彩内容