第6章 多元线性回归

一、遗漏变量偏差

    遗漏变量偏差是指OLS估计量中存在的偏差,它是在回归变量X与遗漏变量相关时产生的。

    遗漏变量偏差意味着第一个最小二乘假设\mathbb{E}(u_i|X_i)=0不成立。

    其理由如下:由前知一元线性回归模型中的误差项u_i表示除了X_i之外所有决定Y_i的因素。若其中某个因素与X_i相关,则意味着误差项u_iX_i相关。

    令X_iu_i的相关系数为corr(X_i,u_i)=\rho_{Xu},第一个假设不成立而第二个和第三个假设成立,则OLS估计量具有如下极限:\hat{\beta}_1\rightarrow\beta_1+\rho_{Xu}\frac{\sigma_u}{\sigma_X}

    (1)无论样本容量是大还是小,遗漏变量偏差问题都存在。

    (2)这一偏差在实践中是大还是小,取决于回归变量和误差项之间的相关系数\rho_{Xu},即|\rho_{Xu}|越大则偏差越大。

    (3)这一偏差的方向取决于Xu是正相关还是负相关。

    可通过数据分组处理遗漏变量偏差。


二、多元回归模型

    多元回归模型(multiple regression model)

    现假定只有两个自变量X_{1i}X_{2i}

    总体回归函数\mathbb{E}(Y_i|X_{1i}=x_1,X_{2i}=x_2)=\beta_0+\beta_1x_1+\beta_2x_2

    截距\beta_0X_{1i}的斜率系数\beta_1X_{2i}的斜率系数\beta_2,有时也称多元回归模型的一个或多个自变量为控制变量

    系数\beta_1的解释不同于模型中只有X_{1i}一个回归变量时的情形:即\beta_1是在保持X_2不变或控制X_2时,X_1变化一个单位对Y的效应。

    固定X_2不变,由于X_1变化了\Delta X_1,于是Y也发生了一些变化,假定为\Delta Y,则Y+\Delta Y=\beta_0+\beta_1(X_1+\Delta X_1)+\beta_2X_2

    得\beta_1=\frac{\Delta Y}{\Delta X_1}X_2保持不变,即X_1Y的偏效应(partial effect)


    加入误差项,有Y_i=\beta_0+\beta_1X_{1i}+\beta_2X_{2i}+u_i,i=1,2,...,n,即总体多元回归模型(population multiple regression model)

    记常数回归变量X_{0i}(constant regressor),\beta_0可以看作是X_{0i}的系数,亦即所有X都等于0时Y的条件期望值,则Y_i=\beta_0X_{0i}+\beta_1X_{1i}+\beta_2X_{2i}+u_i,i=1,2,...,n


三、多元回归的OLS估计量

    一般地,多元回归模型为Y_i=\beta_0+\beta_1X_{1i}+...+\beta_kX_{ki}+u_i,i=1,2,...,n

    最小化预测误差平方和\sum_{i=1}^n(Y_i-b_0-b_1X_{1i}-...-b_kX_{ki})^2

    \beta_0,\beta_1,...,\beta_k普通最小二乘估计量分别为\hat{\beta}_0,\hat{\beta}_1,...,\hat{\beta}_k

    给定X_{1i},X_{2i},...,X_{ki}时,Y_i的预测值为\hat{Y}_i=\hat{\beta}_0+\hat{\beta}_1X_{1i}+...+\hat{\beta}_kX_{ki}

    第i个观测的残差为\hat{u}_i=Y_i-\hat{Y}_i


四、多元回归的拟合优度

    回归标准误差SER=s_{\hat{u}},其中s_{\hat{u}}^2=\frac{1}{n-k-1}\sum_{i=1}^n\hat{u}_i^2=\frac{SSR}{n-k-1}

    回归R^2=\frac{ESS}{TSS}=1-\frac{SSR}{TSS}

    调整回归R^2=1-\frac{n-1}{n-k-1}\frac{SSR}{TSS}=1-\frac{s_{\hat{u}}^2}{s_Y^2}


五、多元回归的最小二乘假设

    多元回归有四个最小二乘假设

    假设1:给定X_{1i},X_{2i},...,X_{ki}u_i的条件分布均值为零

    假设2:(X_{1i},X_{2i},...,X_{ki},Y_i),i=1,2,...,n\quad i.i.d.

    假设3:不太可能出现大异常值

    假设4:不存在完全多重共线性


六、多元回归中OLS估计量的分布

    在多元回归的最小二乘假设中,多元线性回归中的OLS估计量\hat{\beta}_0,\hat{\beta}_1,...,\hat{\beta}_k\beta_0,\beta_1,...,\beta_k的无偏一致估计量;且在大样本下,\hat{\beta}_0,\hat{\beta}_1,...,\hat{\beta}_k的联合分布近似于多维正态分布,且其中每个\hat{\beta}_j服从\mathcal{N}(\beta_j,\sigma_{\hat{\beta}_j}^2),j=0,1,...,k


七、多重共线性

    当一个回归变量是其他回归变量的完全线性组合时,就产生了完全多重共线性(perfect multicollinearity);当一个回归变量和其他回归变量高度相关但不完全相关时,就产生了不完全多重共线性(imperfect multicollinearity)。

    不同于完全多重共线性,不完全多重共线性既不会妨碍回归的估计,也不意味着回归变量选择中存在逻辑问题,但它意味着无法得到其中一个或多个回归系数的精确估计。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,809评论 6 513
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 94,189评论 3 395
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 167,290评论 0 359
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,399评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,425评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 52,116评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,710评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,629评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 46,155评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,261评论 3 339
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,399评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 36,068评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,758评论 3 332
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,252评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,381评论 1 271
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,747评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,402评论 2 358