大师兄的应用回归分析学习笔记(十五):自变量选择与逐步回归(三)

大师兄的应用回归分析学习笔记(十四):自变量选择与逐步回归(二)

三、逐步回归

  • 从多元线性回归中可以看到,并不是所有自变量都对因变量y有显著的影响,这就存在如何挑选出对因变量有显著影响的自变量的问题。
  • 为此,人们提出了一些方法,包括:
  • 前进法
  • 后退法
  • 逐步回归法(最受推崇)
  • 无论从回归方程中提出某个自变量,还是增加某个自变量,都要使用偏F检验
  • 偏F检验与t检验等价,但统计意义更为明了,并且容易推广到多个自变量的显著性检验。
1. 前进法
  • 前进法的思想是变量由少变多,每次增加一个,直至没有可引入的变量为止。
  • 具体做法是:
  • 首先将全部m个自变量分别对因变量y建立一元线性回归方程,并分别计算m个一元线性回归方程的m个回归系数的F检验。
  • 接下来因变量y分别与(x_1,x_2),(x_1,x_3),...,(x_1,x_m)建立二院线性回归方程,对m-1个回归方程中的x_2,x_3,...,x_m的回归系数进行F检验选择F值最大的引入回归方程。
  • 依上述方法重复执行,直到所有未被引入方程的自变量的F值均小于F_\alpha(1,n-p-1)为止,得到的回归方程就是最终确定的方程。
  • 每步检验中的临界值F_\alpha(1,n-p-1)与自变量数目p有关,在软件计算时,实际使用显著性P值做检验。
  • 以2016年31个省市自治区地区生产总值和固定资产投资数据为例:


  • 用前进算法做变量选择,取显著性水平\alpha_{entry}=0.05

  • 从结果中可以看出,前进法一次引入了x_5,x_1,x_2,x_3,最优回归模型为:\hat y=-1632.075+1.346x_1+1.778x_2+2.235x_3+1.798x_5
  • 复决定系数R^2_\alpha=0.995
  • 调整后的R^2_\alpha=0.99
  • 全模型复决定系数R^2=0.99
  • 全模型调整后复决定系数R^2=0.988
2. 后退法
  • 后退法与前进法相反,首先用全部m个变量建立一个回归方程,然后在这m个变量中选择一个最不重要的变量,将它从方程中剔除。



  • 可以看出最优子模型为模型6,回归方程为:\hat y = -1632.075 + 1.346x_1+1.778x_2+2.235x_3+1.798x_5
  • 复决定系数R^2=0.990
  • 调整的复决定系数R^2=0.998
  • 全模型复决定系数R^2=0.995
  • 前进法和后退法都有明显的不足:
  • 前进法有可能不能反映引进新自变量后的变化情况,因为某个自变量开始可能是显著的,当引入其它自变量后就变得不显著,但也没有机会剔除,一旦引入就是终身制。
  • 后退法的不足是,一开始把全部自变量引入回归方程,这样计算量很大。一旦某个自变量被剔除,就再也没有机会进入回归方程。
  • 如果自变量x_1,x_2,...,x_m完全独立,那么在取\alpha_{entry}=\alpha_{removel}时,回归方程应该是相同的,但是实际中很难碰到自变量间真正无关的情况。
3. 逐步回归法
  • 逐步回归法的基本思想是有进有出,具体做法是:
  • 将变量一个一个地引入,
  • 每引入一个自变量后,对已选入的变量要进行逐个检验,
  • 当原引入的变量由于后面变量的引入而变得不再显著时,要将其剔除。
  • 引入一个变量或从回归方程中提出一个变量,为逐步回归的一步,每一步都要进行F检验,以确保每次引入新的变量之前回归方程中只包括显著的变量。
  • 这个过程反复进行,直到既无显著的自变量选入回归方程,也无不显著的自变量从回归方程中剔除为止。
  • 这样就弥补了前进法和后进法各自的缺陷,保证了最后所得的回归子集是最优回归子集。
  • 在逐步回归法中需要注意的问题是引入自变量和剔除自变量的显著性水平\alpha值是不同的,要求引入自变量的显著性水平\alpha_{entry}小于自变量的显著性水平\alpha_{removal},否则可能产生死循环。


©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,002评论 6 509
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,777评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,341评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,085评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,110评论 6 395
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,868评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,528评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,422评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,938评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,067评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,199评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,877评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,540评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,079评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,192评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,514评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,190评论 2 357

推荐阅读更多精彩内容