这期推送简单谈一下我本人对经济学实证论文写作排除干扰性因素、机制检验和异质性分析的一些不甚成熟的理解。
本文首发于微信公众号
DMETP
,欢迎关注!
论文的实证部分一般要回答两个问题,一是核心解释变量x
是否影响被解释变量y
,二是具体的影响机制,即x
如何影响y
。
为了回答第一个问题,论文在基准回归之后一般会设计一系列的识别条件检验和稳健性检验,包括对模型的特定假设进行检验(如DID
的平行趋势检验),对模型可能存在的因果推断问题(内生性)进行讨论、检验和缓解,排除可能影响研究结论的其他干扰性因素,对x
影响y
的预期效应和滞后效应进行讨论等一系列的稳健性检验。某些情况下,对基准回归结果的识别条件检验和稳健性检验甚至需要占据实证部分篇幅的一半以上。
如此大费周章的原因或者说目的在于,一方面,回答好x
是否影响y
这个问题是进一步分析影响机制的基础,因此确保x
对y
的影响稳健可信是实证设计的基本要求;另一方面,我们要赶在读者或审稿人提出“灵魂拷问”之前把论文中可能存在的或大或小的问题都给考虑到,想读者之想,思审稿人之思,虽然不管我们怎么绞尽脑汁去发现和填补这些漏洞,审稿人总是能够提出一些“奇奇怪怪”的问题,但前期做足工作可以把这些问题被问到的可能性降到最低。
对第二个问题进行回答可以增加论文的科学性、故事性和丰满度。x
对y
存在一定的影响,并且这种影响是稳健的,在此基础上我们还想知道x
对y
的影响究竟是通过什么渠道实现的,即探讨“存在性”背后的“过程性”。对客观影响机制的探讨本质上就是对现实经济运行规律的一种总结与提炼,体现了社会科学研究的“科学”之所在。
如果怀疑变量m
是x
对y
作用背后的机制,那么论文的理论分析部分就要对这一机制的基本逻辑进行较为清晰的分析说明,然后在实证部分对这一机制进行检验。机制检验没有一个固定的范式,一般需要结合论文的研究内容、理论、模型,甚至是所使用的数据进行设计,但是经济学研究的机制检验应尽量避免使用中介效应模型,原因在于(引自我在知乎的回答):
相比于管理学、心理学等学科领域,经济学更强调变量之间因果关系的推断,而恰恰由于中介效应模型没有考虑到中介变量可能存在的内生性,因此该模型可能符合管理学的研究范式,但不符合经济学研究范式。
中介效应模型可能存在的内生性在于:
- 第一,在中介变量本身就是一个内生变量的情况下,还要做的IV-2SLS才能说明问题,而大多数文章都没有这一步;而且,就算做到了这一步,由于有效工具变量的稀缺性及论文篇幅(非学位论文)的限制,这一步也是非必要的。
- 第二,在中介效应模型第三步回归中,如果中介变量显著,恰恰说明第一阶段回归的残差中遗漏了一个重要变量,这意味着即使在使用IV对基准模型进行了稳健性检验的情况下,内生性还是存在的,基准回归结果不可信。
参考连玉君老师的回答,中介效应模型存在的一个比较现实的问题是:我们大多数都是在和一个内生变量作斗争,而中介效应要求我们不仅要克服的内生性问题还要克服的内生性问题,着实有些苛刻。
一、排除干扰性因素
排除干扰性因素是实证论文稳健性检验部分的基本步骤之一。
如,陈登科(2020)在研究中国加入WTO后贸易壁垒下降是否带来环境污染的改善时,怀疑加入WTO同时期中国实施的其他政策,特别是国有企业改制政策与鼓励外资进入政策,以及环境规制政策(如两控区、“十一五”污染控制政策)可能对结果造成潜在干扰。为排除这些干扰性因素,作者在回归方程中进一步加入国有经济比重与外贸经济比重来控制前两项政策的影响;对于环境规制政策,作者认为中国的环境规制政策大多是以行政区划为单位来实施的,因此在回归模型中进一步加入地区-年份固定效应来控制环境规制政策对结果的潜在影响。
如,江静琳等(2018)在研究农村成长经历对家庭股票市场参与的影响时,认为影响人类行为的因素十分复杂,因此怀疑农村成长经历对股票市场参与的作用可能受到社会互动、信任水平、金融知识、家庭社会经济地位和风险态度等因素的干扰。为了排除掉这些因素,作者做了一系列的稳健性检验,包括(以社会互动为例):
- 首先,在基准模型中直接添入社会互动水平的代理变量以控制社会互动这一因素对结果的干扰。
- 其次,利用反证法。假设社会互动确实对结果产生了较为严重的干扰,在此假设成立的条件下,有两条推论:一是社会互动水平高的家庭购买股票的行为不受农村成长经历的影响;二是社会互动水平的高低会影响农村成长经历对股票市场参与的作用的大小。如果这两条推论都不成立,也就可以排除掉干扰性因素对研究结果的干扰,据此设计了两段假设检验:一是按照社会互动水平高低将样本分为两组,进行分组回归;二是在基准模型中加入社会互动水平与农村成长经历的交叉项。这两个稳健性检验本质上为异质性分析。
再如,陆菁等(2021)在研究绿色信贷政策的微观效应时,怀疑2008年国际金融危机以及同时期的环境规制政策(如清洁生产标准、“十一五”污染控制政策、区域限批政策等)可能对研究结论构成潜在干扰。对于前者,作者在基准模型的基础上额外控制了代表企业投融资需求的两个代理变量;对于后者,作者引入了若干虚拟变量并剔除了相关样本(具体请看原文)。
[2] 陈登科. 贸易壁垒下降与环境污染改善——来自中国企业污染数据的新证据[J]. 经济研究, 2020, 55(12): 98-114.
[3] 江静琳, 王正位, 廖理. 农村成长经历和股票市场参与[J]. 经济研究, 2018, 53(08): 84-99.
[4] 陆菁, 鄢云, 王韬璇. 绿色信贷政策的微观效应研究——基于技术创新与资源再配置的视角[J]. 中国工业经济, 2021(01): 174-192.
借鉴以上三篇文献,下面简单梳理一下排除干扰性因素的逻辑与实证思路。
由于被解释变量y
的影响因素众多,基准模型中的控制变量也仅仅是根据一般常识与理论(即已有文献的做法)引入的,如果怀疑某个不同寻常的意外因素z
对y
存在一定程度的影响,即直觉上认为z
是y
的不可忽视的重要影响因素,并且在考虑z
的情况下x
对y
的作用可能改变,那么为了检验结论的稳健性,可以把z
当作控制变量引入基准模型中,如果核心解释变量x
的系数与基准回归结果大体保持一致,就说明排除了z
对研究结论的干扰。
此外,还可以使用反证法,即假设z
对研究结论确实构成不可忽视的干扰,那么就存在如下推论:随着z
的取值变化,x
对y
的影响存在异质性,而我们的检验逻辑就是证明该推论不成立。为了证明这个推论不成立,有以下两种实证思路:一是按照z
的取值大小对样本进行分组,进行分组检验,如果在不同分组下x
的系数基本不变且与基准回归结果大体保持一致,就说明该推论不成立;二是使用调节效应模型,调节项为x
与z
的交互项,且两个单独项不可忽视,如果调节效应模型中的交互项不显著(单独项x
是否与基准回归结果保持一致,甚至x
显著与否都不重要,因为在调节模型中x
的系数含义不同),就说明该推论不成立。
二、机制检验
机制检验没有统一范式,一般根据研究内容而定,以佐证论文所讲的故事,比较常用的实证设计包括(引自我在知乎的回答):
调节效应模型,研究在对的影响过程中,调节变量的调节作用,即在基准模型的基础上,做交互项对的影响(本质上也是异质性分析)。
分组回归,即传统意义上的异质性分析。
在基准模型的基础上,检验对机制变量的影响,然后根据已有的文献讨论对的影响。
戴鹏毅等(2021)在研究“沪股通”对企业全要素生产率的作用机制时,认为提高股价信息含量和信息传递效率、矫正股票错误定价和改善信息披露质量是沪股通提升企业TFP的主要机制。在机制检验部分,首先实证检验了“沪股通”开通对这几个机制变量的影响,然后利用已有的权威文献在理论上讨论机制变量对企业全要素生产率的作用。
陈登科(2020)的机制检验思路与之类似,但在逻辑上与其自身的研究内容紧密联系。贸易自由化显著降低了企业的排放强度,而的排放强度等于排放量除以工业总产值,为了讨论企业的排放强度的降低究竟源于排放量的减少还是工业总产值的提高,作者分别用贸易自由化分别对企业排放量和工业总产值做回归,结果显示贸易自由化主要通过降低企业排放量而非提升产出的方式来降低排放强度。在这之后,一个新的疑问是:企业排放量的下降是由生产过程中的产生量下降引起,还是末端处理过程中的处理量增加引起?为了回答该问题,作者用贸易自由化分别对产生量和去除量做回归,结果显示贸易自由化通过降低产生量,而非增加去除量来降低排放。
这样的机制检验思路在逻辑上环环相扣,因此论文的故事性极强。除此之外,论文还对煤炭使用及技术进步这两个具体渠道分别进行了检验。
[5] 戴鹏毅, 杨胜刚, 袁礼. 资本市场开放与企业全要素生产率[J]. 世界经济, 2021, 44(08): 154-178.
三、异质性分析
异质性分析一般可以分为两种:
- 一是根据关键变量对样本进行分组,并进行分组回归。
- 二是关键变量与核心解释变量交乘。
这两种方法的主要区别在于:
- 第一,分组回归假设所有变量的估计系数在不同组别间存在一定的差异,而交互项回归则仅假设除交互项外,其他变量(包括交互项的两个单独项及控制变量)的估计系数不存在组间差异。
- 第二,分组回归的系数大小不可直接比较,因为系数的置信区间可能存在部分重叠,因此分组回归需进行组间系数差异检验。
- 第三,交互项回归的关键变量可以是连续变量。
事实上,异质性分析可以作为机制检验的一种辅助性手段,用以进一步增强论文的故事性。
如,万攀兵等(2021)在研究清洁生产行业标准对企业绿色转型时,在验证技术改造这一具体机制之后,认为技术改造受制于企业的技术改造需求和融资能力,基本逻辑如下:
- 高污染、生产率低、资本更新速度慢的制造业企业由于清洁生产的合规程度较低,在政策影响下面临更为迫切的技术改造需求,技术改造程度更大,从而更容易实现绿色转型。
- 融资约束压力小的制造业企业由于更易于实施技术改造,从而预期获得更好的绿色转型效果。
依据以上逻辑,作者在基准模型中分别加入技术改造需求和融资能力与双重差分的交乘项(即构建三重差分模型DDD
)来捕捉可能的异质性效果。
[7] 万攀兵, 杨冕, 陈林. 环境技术标准何以影响中国制造业绿色转型——基于技术改造的视角[J]. 中国工业经济, 2021(09): 118-136.