5.1 为何需要大样本理论
(1)小样本理论假设过强。如小样本的严格外生性假定要求解释变量与所有的扰动项正交,大样本只要求解释变量与当期的扰动项不相关即可
(2)在大样本下,必须要求统计量的精确分布,大样本只需研究精确分布
(3)大样本理论要求样本量在n≥30,越多越好
5.2 随机收敛
- 依概率收敛convergence in probability
或含义:与之差趋于0 - 确定性收敛almost sure convergence:
含义:Almost sure的意思是,当n趋向于无穷,收敛到的概率为1
备注:确定性收敛可以推导出依概率收敛 - 依均方收敛convergence in L(k) norm (k=2即均方收敛):
- 如果,并且,即期望趋于稳定,方差趋于0,则称随机序列依均方收敛于常数a;
- 如果把a换成其他随机序列,记为,表示两个随机变量的距离随着n趋向于无穷而变为0。均方收敛可以推出依概率收敛
- 依分布收敛convergence in distribution (D):
已知是随机序列的累积分布函数,是随机变量的累积分布函数,如果对于任意实数x,都有,则称:随机序列依分布收敛于随机变量,记为:
5.3 大数定律和中心极限定理
- 弱大数定律
假定为独立同分布的随机序列,且,,则样本均值
含义:样本无限大时,样本均值趋近于总体均值 - 中心极限定理
含义:中心极限定理指的是给定一个任意分布的总体。我每次从这些总体中随机抽取 n 个抽样,一共抽 m 次。 然后把这 m 组抽样分别求出平均值,这些平均值的分布接近正态分布
- 一维情况:
或 - 多维情况:
5.4 统计量的大样本性质
- 均方误差
- 抽样误差:sampling error=
- 以估计量来估计参数,则其“均方误差”(Mean Squared Error,简记为MSE)为MES()=
- 一致估计量
定义:如果,则称估计量是参数的一致估计量
含义:当样本容量足够大的时候,依概率收敛到参数,在大样本估计中,一致性比无偏性更重要 - 渐近正太分布和渐近方差
- 渐近有效
5.5渐进分布的推导
5.6随机过程的性质
- 平稳过程:统计特性不随时间的推移而变化的随机过程
- 严格平稳过程(strictly stationary process)指:对任意m个时期的时间集合,随机向量的联合分布等于随机向量的联合分布,其中k为任意整数。
含义:将中每个变量的下表都前移或后移k期,其分布不变 - 弱平稳过程(weakly stationary process)或协方差平稳过程(covariance stationary process)指:弱平稳过程的期望和房产均为常数,特别的,当期望和方差均为常数0时,称为“白噪声”
- 白噪声(AWGN)就是平稳过程,铙钹的敲击声是非平稳的。尽管铙钹的敲击声基本上是白噪声,但是这个噪声随着时间变化:在敲击前是安静的,在敲击后声音逐渐减弱
渐近独立性:举个例子,今年的通胀率显然与去年的通胀率相关,不会相互独立,但是今年的通胀率和100年以前的通胀率可以看做近似独立的,则成为“渐近独立”,记为:
直观来看:渐近独立意味着只要两个随机变量距离足够远,就可以近似认为他们是独立的如果随机过程满足则称随机过为“鞍”
理解:资本市场有效理论认为,所有关于未来价格的已知信息已经反映在了当期价格上,故有,因此尝试预测价格的未来走势是徒劳的,但是如果信息不对称,则这个结论不一定正确若随机过程满足则称随机过程为“鞍差分序列”,这意味着的均值独立于它所有过去的值
鞍差分序列的中心极限定理(central limit theorem for ergodic stationary MDS):假设为渐近独立的平稳鞍差分随机向量过程,且其协方差矩阵为,记,则有:
5.7 大样本OLS的假定
(1)线性假定
(2)渐近独立的平稳过程
(3)前定解释变量:即所有的解释变量都与同期的扰动项正交,即
(4)秩条件:逆矩阵存在,这个条件时为了保证大样本条件下存在
(5)关于鞍差分序列的假定:为鞍差分序列,其其协方差矩阵为非退化矩阵
- 大样本不要要界定“严格外生性”和“正太随机扰动项”,因此模型更具适用性和稳健性
5.8 OLS的大样本性质
5.9 线性假设的大样本性质
5.10 大样本OLS的stata命令及实例
使用稳健标准误进行回归的命令:
reg y x1 x2 x3,robust