第5章 一元线性回归:假设检验和置信区间

一、关于某个回归系数的假设检验

    t检验:双边假设和单边假设


二、回归系数的置信区间


三、X为二元变量时的回归

    指示变量(indicator variable)&虚拟变量(dummy variable)

    D_i\in\{0,1\},其系数\beta_i不是指斜率,而是看作D_i的系数


四、异方差和同方差

    同方差(homoskedastic),异方差(heteroskedastic)

    如果对任意i=1,2,...,n,给定X_iu_i条件分布的方差var(u_i|X_i=x)是常熟且不依赖于x时,误差项u_i是同方差的;否则,是异方差的。

    同方差的数学含义:

    1.OLS估计量仍然是无偏和近似正态的

    2.误差同方差时OLS估计量的效率

    3.同方差使用方差公式


五、普通最小二乘的理论基础

    若三个最小二乘假设成立且误差同方差,则在X_1,X_2,...,X_n条件下,OLS估计量是所有线性条件无偏类估计量中方差最小的。换言之,OLS估计量是最佳线性条件无偏估计量(Best Linear Conditional Unbiased Estimator,BLUE)

    Guass-Markov定理的局限性:

    第一,其条件在实际应用中可能不成立,尤其是当误差异方差时,经济应用中常常是异方差的,此时OLS估计量不再是BLUE。

    第二,既是定理条件成立,但也存在着其他非线性的条件无偏估计量,并且在某些条件下,这些估计量更有效。


    不同于OLS的回归估计量:

    1.加权最小二乘法(weighted least squares,WLS)

        其中第i个观测的权重为给定X_iu_i的条件方差平方根的倒数

    2.最小绝对变差估计量

        将“误差”平方改为了“误差”绝对值\sum_{i=1}^n|Y_i-b_0-b_1X_i|


六、样本容量较小时t统计量在回归中的运用

    当样本容量较小时,t统计量的精确分布的非常复杂的并且依赖于数据的未知总体分布。但如果三个最小二乘假设成立,无差同方差且回归误差服从正态分布,则OLS估计量服从正态分布且同方差适用的t统计量服从学生t分布。

    即同方差正态回归假设(homoskedastic normal regression assumption)

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容