本文为经典文献阅读系列。我会把一些经典 paper 的数学部分非常详细地推一遍,对于需要引用其他文章才能证明的坑,会在文末给出寻找的索引。
对于文本,非引用的地方一般是作者在 paper 中给出的公式,
而在引用框里的公式则是我本人推导
还有一些自己的想法
希望大家批评指正!
对面板门槛模型:
也可以写成:
其实还可以写成:
其中:
要使用面板门槛模型,最关键的地方在于两个检验:
- 门槛效应是否存在
- 门槛值是否可信
1 门槛效应是否存在
检验门槛效应是否显著的检验,即检验原假设:
这个原假设可以使用 统计量:
来检验,其中:
是非门槛模型得到的 MSE
是在门槛值为 处得到的MSE
统计量并不服从任何标准的分布,==Hansen(1996)==证明了 Bootstrap 程序得到其一阶渐进分布,以此得到的 -value 也可以用于进行统计推断。
2 门槛值是否估计准确
在门槛效应显著的情形下,我们要进行的下一步检验是:
其中, 是真实的门槛值。这个假设可以用 统计量检验:
本文证明了,在一定的假设条件下,如果原假设成立,那么:
其中, 时, 服从分布函数:
于是反分布函数为:
所以可以设置各置信水平的上分位值,比如:10% 的置信水平对应的分位值为6.53;而 5% 的分位值是7.53;最后,1% 的分位值时 10.59。那么如果 的值超过了 ,那么我们就可以在 的置信水平上拒绝原假设 。
所以最难的地方在于如何找到 的理论分布,下面的数学推导摘录自文章的 Appendix。
3 关于 的推导
3.1 定义和假设
对面板门槛模型:
也可以写成:
其实还可以写成:
其中:
令 表示模型中 的真实取值。并定义:
,其中
表示门槛变量 的密度函数
,其中 表示 的转置
表示给定 下 的条件密度函数
假设:
对任意 , 都是 iid 的
对任意 , 与 是独立的,而且
对 , ,其中 是 的第 个元素
,且
对固定的 和 ,
在 处连续
对任意的 ,
其中,假设 1.-4. 是固定效应面板模型和严格外生变量的基本假设。假设 6. 排除了在回归变量的边际分布和回归函数中同时出现的阈值效应。假设 7. 排除了连续化门槛模型,并要求门槛变量 在 处是连续且正的分布的。假设 8. 排除了对任意 , 的情况
最值得玩味的假设是 5.,它假设 时,
这个假设减少样本中与门槛值值有关的信息,从而减慢阈值估计的收敛速度。 由于可以将 降至零的速率设置得很低(通过参数 的调节),因此不必将此假设视为限制性很强。 但是,这确实表明,相对于 大的情况,当 小时,渐近逼近更有可能提供良好的性质。
3.2 推导
让 表示关于统一度量的弱收敛,记 。于是:
定理 A.1 在 下,对随机变量 ,有:
其中:
- 是一个在 上的双边布朗运动(double-sided standard Brownian motion)
证明 A.1 令:
当 时,门槛模型成立。对任何 ,回归模型可以被写成:
其中,这里用到了:
这里证明一下,定义:
关键的部分是如何对 和 的关系进行建模。由于 ,那么可以用
来刻画其关系。这种关系对于 和 也成立,于是:
证毕。
公式 给出了当 时回归的精确误差(比正确的模型多了一个 的误差修正项)。由于组内估计量的转换是线性的,所以对公式 也同样适用,于是我们有:
这波很好操作,对公式 在时间上求平均:
然后把上式对公式 做差,并记 等带星号的变量为离差形式,就有:
了。
此模型才是当 时应该使用的回归方程。Hasen(1999)表示, 的渐进分布并不受 的影响,这个结论在这里也成立(这是因为,门槛的存在与系数是独立的)。于是对一个固定的 来说,回归残差是:
这是因为当 ,且 和 毫无关系时,对一个固定的 而言,对 的估计的残差可以写作
也就是 不变下,对 的估计的残差,可以被认为是公式 后面的一个整体。再次强调,可以把 看作误差修正项。
有了公式 ,我们于是可以计算,对两个给定不同门槛值 和 ,模型的 MSE 之差为:
现在我们拥有了 的表达式,后面的目标是找到它服从什么分布。
节点1: 的左边
现在我们证明,对于 ,当 ,对 (" uniformly over "),公式 的左项有:
我们会证明在 的情况下,公式 成立。==Hansen(1999)的定理 A.10==证明,它的充分条件是对于 ,公式 成立:
证明:第一个等号:基于万物 iid 假设, 之间关于 也是 iid 的,于是:
证毕。做类似的证明经常用到几个技巧:
iid 的假设下,大数定律:
期望算子的线性性:
无关下标的 是可以化成系数的:
掌握这些技巧对做类似的推导和证明很有作用。
把公式 的平方展开,有:
证明 A.6:直接把离差形式变成原来的形式:
注意到第三项是的第一个 是对 求和,而期望的内部是对 求和,于是第一个 仅仅是简单的叠加,于是 。用同样的道理,可以把第二项写成公式 的形式,即:
这就离公式 很接近了,接下来我们要证明的是:
这两个东西在本质上都是和的平方,见:
证毕。
从这里开始,我们转向概率分布
考虑公式 的右边的第一项,注意到在 时,,于是 时:
因为 时 ,根据累计分布函数的定义,这实际上是导数的定义:
即,求累计分布函数在 处的微分,也就是求密度函数。另外:
而:
两个式子一乘,就有上面的结果了。其数学意义是,在样本容量很大时, 落在 之间的概率的 倍趋向于 的概率密度函数在 处的 倍。其中 服从均匀分布。其实我觉得,写成:
更直观,也就是 落在 之间的概率是 的概率密度函数乘以一个系数。这个系数是一个均匀分布的 和一个随样本容量 时趋向于无穷的量()的商。在 时, 趋向于一个点,从而概率是 。正好符合 pdf 的性质。
于是,最关键的一步来了:
这一步最巧妙的地方在于,把 与一个示性函数的积的期望表示为该示性函数发生的条件下 条件期望,从而实现从期望到密度函数的转化。
之所以要转而证明 成立,是因为 不能分离 和 ,而前者的期望算子具备这样的良好的数学性质。
接下来考虑公式 的第二项。对于 ,
当 ,两个无穷小量 、 之间有记号 ,如果 时,无穷小量 是关于 的高阶无穷小,即 时,
特别地,当 时,,那么就记为:
对于记号 ,就是当 时, 保持有界,就记作:
特别地,记号:
表示在 时, 是有界的量。
第二个等号到第三个等号其实是在 附近用切线近似割线的值。于是,记 的 pdf 为 。在 处做 1 阶数展开,就有:
如果对上面的式子直接求 的极限,那么可以直接得到:
因为 有界,, 。作者可能是为了让我们看的更清楚(并没有),把求极限的两个部分拆开了,计算的是割线的近似:
之所以是 ,是因为在 时,上式就是导数的定义,没有误差。
结合 ,对于 ,
证明:
证毕。
公式 对 的情形也适用(对称的)。于是:
证明:倒数第二个等号
于是,左项就是我们要获取的。现在我们需要证明,
由于各部分大于等于 ,加起来为 ,于是改证:在 时,,使得
这就是 A.9 啊。证毕。
于是把 和 代入 ,就有:
其中,我们证明了 的情形,实际上对于 也适用,所以用
于是我们找到公式 的左边了。
节点2: 的右边
我们下面尝试证明公式 的右边是:对于 ,
最小二乘的投影性质表明:,并且 是 iid 的,于是:
证明:第一个等号:
后面我们证明第二项等于零:
证毕。
证明:第二个等号
证毕。
第三个等号用了 时,。
这就确定了随机过程的有限维分布是双向布朗运动(double-sided Brownian motion)的。通过 Hasen(1999) 的定理 A.11,这里的公式 和假设1足以推导出公式 。于是公式 和 结合公式 就可以得出定理 A.1了。
定理 1 的证明
由于 是要最小化 ,于是 实际上满足:
==Hasen(1999)表明==,在假设 1 成立的条件下:
一个随机向量 是 的,如果他是随机有界的;是 的,如果它按照概率收敛到0
本文不会重复证明公式 。公式 的随机有界性表明,对任何 ,总存在一个 ,使得:
在这里,随机有界的定义是:对任何 ,如果存在一个 ,使得:
那么就说:
特别地,如果随机序列 退化为常数序列 ,那么我们就记为
令:
这里的收敛符号使用了 时 和刚刚证明的定理 A.1:
定理 A.1 在 下,对随机变量 ,有:
其中:
- 是一个在 上的双边布朗运动(double-sided standard Brownian motion)
公式 表明,
这个不等式表明:
其中,Hasen(1999)的定理 2证明了 的分布函数为:
坑
需要从《Sample splitting and threshold estimation》(Hasen,2000)获取的证明有:
- 定理 A.10:
- 定理 A.11:
- 定理 2:
- 不知道是哪个定理: