本文为经典文献阅读系列。我会把一些经典 paper 的数学部分非常详细地推一遍,对于需要引用其他文章才能证明的坑,会在文末给出寻找的索引。
对于文本,非引用的地方一般是作者在 paper 中给出的公式,
而在引用框里的公式则是我本人推导
还有一些自己的想法
希望大家批评指正!
对面板门槛模型:
也可以写成:
其实还可以写成:
其中:
要使用面板门槛模型,最关键的地方在于两个检验:
- 门槛效应是否存在
- 门槛值是否可信
1 门槛效应是否存在
检验门槛效应是否显著的检验,即检验原假设:
这个原假设可以使用 统计量:
来检验,其中:
是非门槛模型得到的 MSE
是在门槛值为
处得到的MSE
统计量并不服从任何标准的分布,==Hansen(1996)==证明了 Bootstrap 程序得到其一阶渐进分布,以此得到的
-value 也可以用于进行统计推断。
2 门槛值是否估计准确
在门槛效应显著的情形下,我们要进行的下一步检验是:
其中, 是真实的门槛值。这个假设可以用
统计量检验:
本文证明了,在一定的假设条件下,如果原假设成立,那么:
其中, 时,
服从分布函数:
于是反分布函数为:
所以可以设置各置信水平的上分位值,比如:10% 的置信水平对应的分位值为6.53;而 5% 的分位值是7.53;最后,1% 的分位值时 10.59。那么如果 的值超过了
,那么我们就可以在
的置信水平上拒绝原假设
。
所以最难的地方在于如何找到 的理论分布,下面的数学推导摘录自文章的 Appendix。
3 关于
的推导
3.1 定义和假设
对面板门槛模型:
也可以写成:
其实还可以写成:
其中:
令 表示模型中
的真实取值。并定义:
,其中
表示门槛变量
的密度函数
,其中
表示
的转置
表示给定
下
的条件密度函数
假设:
对任意
,
都是 iid 的
对任意
,
与
是独立的,而且
对
,
,其中
是
的第
个元素
,且
对固定的
和
,
在
处连续
对任意的
,
其中,假设 1.-4. 是固定效应面板模型和严格外生变量的基本假设。假设 6. 排除了在回归变量的边际分布和回归函数中同时出现的阈值效应。假设 7. 排除了连续化门槛模型,并要求门槛变量 在
处是连续且正的分布的。假设 8. 排除了对任意
,
的情况
最值得玩味的假设是 5.,它假设 时,
这个假设减少样本中与门槛值值有关的信息,从而减慢阈值估计的收敛速度。 由于可以将 降至零的速率设置得很低(通过参数
的调节),因此不必将此假设视为限制性很强。 但是,这确实表明,相对于
大的情况,当
小时,渐近逼近更有可能提供良好的性质。
3.2 推导
让 表示关于统一度量的弱收敛,记
。于是:
定理 A.1 在 下,对随机变量
,有:
其中:
-
是一个在
上的双边布朗运动(double-sided standard Brownian motion)
证明 A.1 令:
当 时,门槛模型成立。对任何
,回归模型可以被写成:
其中,这里用到了:
这里证明一下,定义:
关键的部分是如何对
和
的关系进行建模。由于
,那么可以用
来刻画其关系。这种关系对于和
也成立,于是:
证毕。
公式 给出了当
时回归的精确误差(比正确的模型多了一个
的误差修正项)。由于组内估计量的转换是线性的,所以对公式
也同样适用,于是我们有:
这波很好操作,对公式
在时间上求平均:
然后把上式对公式做差,并记
等带星号的变量为离差形式,就有:
了。
此模型才是当 时应该使用的回归方程。Hasen(1999)表示,
的渐进分布并不受
的影响,这个结论在这里也成立(这是因为,门槛的存在与系数是独立的)。于是对一个固定的
来说,回归残差是:
这是因为当
,且
和
毫无关系时,对一个固定的
而言,对
的估计的残差可以写作
也就是不变下,对
的估计的残差,可以被认为是公式
后面的一个整体。再次强调,可以把
看作误差修正项。
有了公式 ,我们于是可以计算,对两个给定不同门槛值
和
,模型的 MSE 之差为:
现在我们拥有了 的表达式,后面的目标是找到它服从什么分布。
节点1:
的左边
现在我们证明,对于 ,当
,对
("
uniformly over
"),公式
的左项有:
我们会证明在 的情况下,公式
成立。==Hansen(1999)的定理 A.10==证明,它的充分条件是对于
,公式
成立:
证明:第一个等号:基于万物 iid 假设,
之间关于
也是 iid 的,于是:
证毕。做类似的证明经常用到几个技巧:
iid 的假设下,大数定律:
期望算子的线性性:
无关下标的
是可以化成系数的:
掌握这些技巧对做类似的推导和证明很有作用。
把公式 的平方展开,有:
证明 A.6:直接把离差形式变成原来的形式:
注意到第三项是的第一个
是对
求和,而期望的内部是对
求和,于是第一个
仅仅是简单的叠加,于是
。用同样的道理,可以把第二项写成公式
的形式,即:
这就离公式很接近了,接下来我们要证明的是:
这两个东西在本质上都是和的平方,见:
证毕。
从这里开始,我们转向概率分布
考虑公式 的右边的第一项,注意到在
时,
,于是
时:
因为
时
,根据累计分布函数的定义,这实际上是导数的定义:
即,求累计分布函数在处的微分,也就是求密度函数。另外:
而:
两个式子一乘,就有上面的结果了。其数学意义是,在样本容量很大时,落在
之间的概率的
倍趋向于
的概率密度函数在
处的
倍。其中
服从均匀分布。
其实我觉得,写成:
更直观,也就是落在
之间的概率是
的概率密度函数乘以一个系数。这个系数是一个均匀分布的
和一个随样本容量
时趋向于无穷的量(
)的商。
在
时,
趋向于一个点,从而概率是
。正好符合 pdf 的性质。
于是,最关键的一步来了:
这一步最巧妙的地方在于,把
与一个示性函数的积的期望表示为该示性函数发生的条件下
条件期望,从而实现从期望到密度函数的转化。
之所以要转而证明
成立,是因为
不能分离
和
,而前者的期望算子具备这样的良好的数学性质。
接下来考虑公式 的第二项。对于
,
当
,两个无穷小量
、
之间有记号
,如果
时,无穷小量
是关于
的高阶无穷小,即
时,
特别地,当时,
,那么就记为:
对于记号,就是当
时,
保持有界,就记作:
特别地,记号:
表示在时,
是有界的量。
第二个等号到第三个等号其实是在
附近用切线近似割线的值。于是,记
的 pdf 为
。在
处做 1 阶数展开,就有:
如果对上面的式子直接求的极限,那么可以直接得到:
因为有界,
,
。
作者可能是为了让我们看的更清楚(并没有),把求极限的两个部分拆开了,计算的是割线的近似:
之所以是,是因为在
时,上式就是导数的定义,没有误差。
结合 ,对于
,
证明:
证毕。
公式 对
的情形也适用(对称的)。于是:
证明:倒数第二个等号
于是,左项就是我们要获取的。现在我们需要证明,
由于各部分大于等于,加起来为
,于是改证:在
时,
,使得
这就是 A.9 啊。证毕。
于是把 和
代入
,就有:
其中,我们证明了
的情形,实际上对于
也适用,所以用
于是我们找到公式 的左边了。
节点2:
的右边
我们下面尝试证明公式 的右边是:对于
,
最小二乘的投影性质表明:,并且
是 iid 的,于是:
证明:第一个等号:
后面我们证明第二项等于零:
证毕。
证明:第二个等号
证毕。
第三个等号用了 时,
。
这就确定了随机过程的有限维分布是双向布朗运动(double-sided Brownian motion)的。通过 Hasen(1999) 的定理 A.11,这里的公式 和假设1足以推导出公式
。于是公式
和
结合公式
就可以得出定理 A.1了。
定理 1 的证明
由于 是要最小化
,于是
实际上满足:
==Hasen(1999)表明==,在假设 1 成立的条件下:
一个随机向量
是
的,如果他是随机有界的;是
的,如果它按照概率收敛到0
本文不会重复证明公式 。公式
的随机有界性表明,对任何
,总存在一个
,使得:
在这里,随机有界的定义是:对任何
,如果存在一个
,使得:
那么就说:
特别地,如果随机序列退化为常数序列
,那么我们就记为
令:
这里的收敛符号使用了 时
和刚刚证明的定理 A.1:
定理 A.1 在
下,对随机变量
,有:
其中:
是一个在
上的双边布朗运动(double-sided standard Brownian motion)
公式 表明,
这个不等式表明:
其中,Hasen(1999)的定理 2证明了 的分布函数为:
坑
需要从《Sample splitting and threshold estimation》(Hasen,2000)获取的证明有:
- 定理 A.10:
- 定理 A.11:
- 定理 2:
- 不知道是哪个定理: