双重差分法 | 空间DID

简单谈一下我本人对空间双重差分模型（Spatial Difference in Difference Model，SDID）几点或许不太成熟的理解。

（本文首发于个人微信公众号DMETP，欢迎关注！）

一、从聚类标准误到空间相关性

当使用面板数据进行固定效应模型估计时，考虑到组间异方差和组内自相关，我们必然需要将标准误进行聚类调整。一般来说，聚类调整后的标准误大于异方差稳健标准误，而异方差稳健标准误大于普通标准误，因此，根据聚类标准误做出来的结果是相对最稳健的，这里所说的稳健，指的是系数显著性稳健，因为标准误影响t值，而对系数的本身影响不大。

然而，将标准误聚类调整到什么层次是一个问题。当将个体（id）作为聚类依据时，即假定每个个体不同年份的干扰项存在相关性（组内自相关），而不同个体的干扰项不存在相关性（组间不相关）。但是，这样的假定可能不符合现实情况，比如，对于微观企业来说，同一行业的企业之间必然存在竞合关系，此时同一行业不同企业之间就存在相关性，在这种情况下，将标准误聚类调整到行业层面可能更合理。因此，为了得出更稳健的结果，也为了说服苛刻的读者（或审稿人）接受我们根据实证结果得出的结论，将标准误聚类到更高层级是一种更安全的做法，当然，聚类层级越高系数越不显著。

然而，有时候我们没有甚至不能将标准误聚类到更高层级。除了显著性与稳健性之间的权衡，更多的原因在于聚类层级越高聚类数目越少，而大样本理论要求聚类数目足够大，这样才能保证所估计的标准误收敛到真实值（Petersen，2009），根据拇指法则，聚类数少于30可能就不太合适了。

退而求其次，为了同时兼顾聚类层级与聚类数目，有些文献将标准误聚类到行业-年份层面（在Stata中可以利用分组函数group生成聚类变量再在回归中进行聚类调整，即：先egen ind_year = group(industry year)，然后reghdfe y xlist, absorb(id year) cluster(ind_year)），如李青原和章尹赛楠（2021）、邵朝对等（2021），即假定同一年同一行业之间存在自相关，而不同年或不同行业之间不存在自相关。

参考文献：

[1] Petersen M A. Estimating Standard Errors in Finance Panel Data Sets: Comparing Approaches[J]. Review of Financial Studies, 2009, 22(01): 435-480.

[2] 李青原, 章尹赛楠. 金融开放与资源配置效率——来自外资银行进入中国的证据[J]. 中国工业经济, 2021(05): 95-113.

[3] 邵朝对, 苏丹妮, 杨琦. 外资进入对东道国本土企业的环境效应: 来自中国的证据[J]. 世界经济, 2021, 44(03): 32-60.

根据常识与理论将标准误聚类调整到行业-年份层面，即先验式地承认同一年份同一行业的企业存在相关性，同理，当聚类到省份-年份层面或区域-年份层面时，也可以认为同一年同一地区（省份或区域）不同个体之间存在相关性，这与构建空间计量模型（Spatial Econometric Model）的思想不谋而合。

空间计量模型最大的特征是放松了空间单位之间相互独立的假设，即认为本地区与邻近地区存在相互关系，本地区变量的变动不仅直接影响本地区，也会影响邻近地区，而且通过影响邻近地区最后反作用于本地区。本地区对本地区的影响称为直接效应（Direct Effect），本地区对邻近地区的平均影响称作间接影响或空间溢出效应（Indirect Effect or Spatial Spillover Effect）。对具体空间相关形式的判断，是在OLS模型的基础上对其残差进行拉格朗日乘子检验（LM test）和稳健的拉格朗日乘子检验（robust LM test），以检验OLS回归残差中是否存在某种形式的空间关联，即检验OLS回归残差中是否包含被解释变量的空间滞后项（ $wy$ ）抑或扰动项的空间滞后项（ $w\varepsilon$ ）（Burridge，1980；Anselin，1988；Anselin at al.，1996；Elhorst，2014）。

参考文献：

[4] Burridge P. On the Cliff‐Ord Test for Spatial Correlation[J]. Journal of the Royal Statistical Society: Series B (Methodological), 1980, 42(01): 107-108.

[5] Anselin L: Spatial Dependence in Regression Error Terms, Anselin L, editor, Spatial Econometrics: Methods and Models, Dordrecht: Springer Netherlands, 1988: 100-118.

[6] Anselin L, Bera A K, Florax R, et al. Simple Diagnostic Tests for Spatial Dependence[J]. Regional Science & Urban Economics, 1996, 26(01): 77-104.

[7] Elhorst J P. Matlab Software for Spatial Panels[J]. International Regional Science Review, 2014, 37(03): 389-405.

因此，从这种意义上来说，当标准误聚类调整到地区-年份层面时，此时假定中的同一年份同一地区不同个体之间存在的相关性（组内自相关）本质上是一种空间相关性。也就是说，当我们将标准误聚类调整到地区-年份层面时，实质上就已经变相说明模型中存在一定的空间相关性。

二、个体处理效应稳定性假设

在DID中，一个经典的假设是个体处理效应稳定性假设（Stable Unit Treatment Value Assumption，SUTVA）。SUTVA最重要的一点是“处理组个体不会影响控制组个体”（Rubin，1974）。换言之，在SUTVA框架下，总体中的任何个体并不会受到其他个体接受处理与否的影响（王金杰和盛玉雪，2020）。然而，这个假设在考虑到空间相关性时被打破了，或者说，当不同空间单元之间存在相关性即存在空间溢出效应时，SUTVA不再成立（Kolak & Anselin，2019）。

参考文献：

[8] Rubin D B. Estimating Causal Effects of Treatments in Randomized and Nonrandomized Studies[J]. Journal of Educational Psychology, 1974, 66(05): 688-701.

[9] 王金杰, 盛玉雪. 社会治理与地方公共研发支出——基于空间倍差法的实证研究[J]. 南开经济研究, 2020, 1(01): 199-219.

[10] Kolak M, Anselin L. A Spatial Perspective on the Econometrics of Program Evaluation[J]. International Regional Science Review, 2019, 43(02): 128-153.

事实上，SUTVA在大多数情况下可能都不成立，而现有的DID类实证文章很少会考虑到这一点，并且Ferman（2020）指出忽略空间相关性将导致标准误被低估，从而夸大系数的显著性。

参考文献：

[11] Ferman B. Inference in Differences-in-Differences: How Much Should We Trust in Independent Clusters? [R]. MPRA Paper 93746, University Library of Munich, Germany, 2020.

一个简单的道理，处理组在期初实施了某项政策，控制组没有实施，但不是说政策实施之后只会对处理组产生影响，通过示范、学习、要素流动等渠道也会作用于控制组，因此，政策的施行在长期将会在一个较广的区域范围内产生普遍（但不一致）的影响。

这里有两个问题，一个是政策实施对控制组作用的力度，另一个是作用的方向。

首先，在处理组实施的某项政策不会对全域内所有地区产生相同的影响，可能两地间经济联系越密切，政策的空间溢出效应越强；可能两地共享同一地理边界（邻接），空间溢出效应越明显；可能两地核心城市之间的地理距离或路程距离越短，空间溢出效应就越强。总之，政策的施行不会对其他地区产生一致的影响，而会随着某种空间相互关系的趋弱存在衰减效应，而我们论文中的SDID就是围绕这种空间相互关系进行研究设计的（空间权重矩阵的设置）。

其次，处理组实施的某项政策对邻近地区的影响有正有负。一方面，政策施行导致资源向先行区倾斜集聚，这不仅意味着先行地区内部资源的重新配置，而且也将导致邻近地区的资源（如劳动力、资金等）向该地区流动富集，这样的结果是抑制了邻近控制组的经济发展，形成了“虹吸效应”。另一方面，先行发展的示范区一般都是经济发展较好的地区（这同时说明DID可能存在严重的样本自选择问题！），政策实施后这些地区将已有的、相对落后的产能向周围转移，连带着将相关人才、技术与资金转移，通过这样的一种方式促进了邻近地区的发展，形成了所谓的“涓滴效应”。总之，政策的施行对邻近地区产生正反两方面的影响，而我们的工作就是要精准稳健地测度出这种影响，并进一步分析出这种异质性影响背后的形成机制或者说机理。

三、政策实施的空间溢出效应

下面结合几个实例给出SDID模型设计的参考。

空间计量模型中和DID结合最多的是自变量空间滞后模型（The Spatial Lag of X Model，SLX），而SLX是在普通线性模型等式右端引入（所有）自变量的空间滞后项，形如式 $(1)$ ：

$Y=\alpha \iota _N+X\beta +WX\theta +\varepsilon \tag{1}\label{eq1}$

式 $(1)$ 中的 $WX$ 即为所有自变量的空间滞后项，由于等式右端不包括被解释变量的空间滞后项，该模型可以视为普通的线性模型，并使用OLS方法进行估计。因此，式 $(1)$ 中的 $\beta$ 衡量的是直接效应的大小， $\theta$ 测度的是间接效应的大小（Vega & Elhorst，2015）。

参考文献：

[12] Vega S H, Elhorst J P. The SLX Model[J]. Journal of Regional Science, 2015, 55(03): 339-363.

SDID基于式 $(1)$ ，但等式右边只有DID交互项的空间滞后项，其余自变量均以其初始形式作为控制变量，形如式 $(2)$ ：

$Y=\alpha \iota _N+X\beta +\varphi did+\theta Wdid+\varepsilon \tag{2}\label{eq2}$

其中， $\varphi$ 代表政策的直接效应，即绝大多数论文中所要考察的处理效应（Treatment Effect），而 $\theta$ 代表政策的间接效应或空间溢出效应。

王金杰和盛玉雪（2020）在研究社会治理与地方公共研发支出的关系时，将十八届三中全会以来的社会治理作为准自然实验，设计了如下式 $(3)$ 的实证模型。

$Y=\phi +\theta +\left(\alpha +\beta W\right)D+X\gamma ^{'}+WX\delta ^{'} + \varepsilon \tag{3}\label{eq3}$

其中，DID交互项（ $D$ ）空间滞后项系数 $\beta$ 衡量的是平均的溢出效应。

可以看出，形如式 $(2)$ 和式 $(3)$ 的SDID只能测度平均的空间溢出效应，空间滞后项系数的大小代表在所有处理组实施的政策对邻近地区的影响。从这个意义上来说，以上的研究设计本质上讨论的是空间依赖性，而非空间异质性，而对空间异质性的讨论或许是我们应该关注的重点，即：在处理组实施的某项政策，在多大范围内存在空间溢出效应？

沈坤荣和金刚（2018）在评估河长制的水污染治理效果时，设计了如下式 $(4)$ 的实证模型。

$Pollutant_{it}=\beta Hezhangzhi_{it}+\alpha \sum_{\delta}{\sum_jw_{ij}^{\delta \text{~}\delta +100}Hezhangzhi_{jt}+\lambda X_{it}+\alpha _i+\gamma _t+\varepsilon _{it}} \tag{4}\label{eq4}$

其中， $w_{ij}^{\delta \text{~}\delta +100}$ 表示阈值为 $[\delta,\delta +100]$ 的地理距离倒数矩阵元素，当 $i$ 地和 $j$ 地之间的距离在阈值范围内，该元素取值为距离倒数，否则为0。

可以看出，形如式 $(4)$ 的SDID模型以100 $km$ 为步进距离，考察在不同地理阈值范围内空间溢出效应的大小。图 1是不同地理阈值范围内系数 $\alpha$ 的大小与显著性。

图 1 河长制的空间溢出效应

参考文献：

[13] 沈坤荣, 金刚. 中国地方政府环境治理的政策效应——基于“河长制”演进的研究[J]. 中国社会科学, 2018(05): 92-115+206.

然而，也有部分文献通过巧妙的模型设计，在不使用SDID的情况下，测度了不同阈值范围内政策实施的空间溢出效应。

曹清峰（2020）在评估国家级新区的经济效应时，认为国家级新区通过空间溢出效应促进了区域协调发展。该文的实证模型设计如下式 $(5)$ ：

$gdpr_{it}=\beta _0+\beta _1did_{it}+\sum_{s=50}^{400}\delta _sN_{it}^s+\lambda Z_{it}+\nu _i+\mu _t+\varepsilon _{it} \tag{5}\label{eq5}$

其中， $s$ 表示不同城市间的球面距离；如果在 $t$ 年距离城市 $i(s-50,s]$ 的空间范围内存在国家级新区， $N_{it}^s=1$ ，否则 $N_{it}^s=0$ ；系数 $\delta_s$ 衡量了国家级新区设立后对邻近城市经济增长率的影响。图 2是不同地理阈值范围内系数 $\delta_s$ 的大小与显著性。