第十五章 多元线性回归分析

这一章首先介绍多元线性回归的及其基本统计量,偏回归系数,决定系数R方及adjusted R方,接着对各自变量的作用进行评价和选择,最后是多元线性回归模型的使用注意事项

知识清单

  • 多元线性回归
    • 回归模型及方程
    • 总体方程的评价指标
    • 各自变量的假设检验及评价

1. 多元线性回归

1.1 回归模型及方程

使用条件

  • 有线性关系
  • 观测值(应变量值)相互独立
  • 残差服从正态分布

R语言实现多元线性回归

数据例15-1

# data15_1 <- haven::read_sav(
#   file="E:\\医学统计学(第4版)\\各章例题SPSS数据文件\\例15-01.sav")
# colnames(data15_1) <- c("id", "x1", "x2", "x3", "x4", "y")
load(url("https://github.com/x2yline/statistics_note/blob/master/chapter15/%E4%BE%8B15_1.rdata?raw=true"))
head(data15_1, 4)
##   id   x1   x2   x3   x4    y
## 1  1 5.68 1.90 4.53  8.2 11.2
## 2  2 3.79 1.64 7.32  6.9  8.8
## 3  3 6.02 3.56 6.95 10.8 12.3
## 4  4 4.85 1.07 5.88  8.3 11.6
line.model <- lm(y~x1+x2+x3+x4, data=data15_1)
print(line.model)
## 
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4, data = data15_1)
## 
## Coefficients:
## (Intercept)           x1           x2           x3           x4  
##      5.9433       0.1424       0.3515      -0.2706       0.6382

1.2 总体方程的评价指标

该部分指标对应summary(line.model)的部分结果

summary(line.model)
## 
## Call:
## lm(formula = y ~ x1 + x2 + x3 + x4, data = data15_1)
## 
## Residuals:
##     Min      1Q  Median      3Q     Max 
## -3.6268 -1.2004 -0.2276  1.5389  4.4467 
## 
## Coefficients:
##             Estimate Std. Error t value Pr(>|t|)  
## (Intercept)   5.9433     2.8286   2.101   0.0473 *
## x1            0.1424     0.3657   0.390   0.7006  
## x2            0.3515     0.2042   1.721   0.0993 .
## x3           -0.2706     0.1214  -2.229   0.0363 *
## x4            0.6382     0.2433   2.623   0.0155 *
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## 
## Residual standard error: 2.01 on 22 degrees of freedom
## Multiple R-squared:  0.6008, Adjusted R-squared:  0.5282 
## F-statistic: 8.278 on 4 and 22 DF,  p-value: 0.0003121

回归方程的方差分析

把总离均差平方和分解为回归平方和与残差平和,再作方差分析

f_stat <- summary(line.model)$fstatistic
cat(f_stat)
## 8.277793 4 22
pf(f_stat[1], 
   df1=f_stat[2], 
   df2=f_stat[3], 
   lower.tail=FALSE)
##        value 
## 0.0003121289

决定系数R方

与直线回归定义相同,即回归平方和/总离均差平方和

ss1 <- sum((line.model$residuals)^2)
ss2 <- sum((data15_1$y-mean(data15_1$y))^2)
R.squared <- 1-(ss1/ss2)
cat(R.squared)
## 0.6008069

复相关系数: 决定系数开根号

由于R方总会随着模型中自变量的增加而增大,所以后面会有校正的R方这一算法,即去除由于自变量增加的影响,使其值更能反映模型的好坏

校正的R方:

obj_n <- nrow(data15_1)
var_n <- 4
R.adj <- 1-(1-R.squared)*(obj_n-1)/(obj_n-var_n-1)
cat(R.adj)
## 0.5282263

1.3 各自变量的假设检验及评价

偏回归平方和:从回归方程总剔除Xi后,所引起的回归平方和减少量,或在其他自变量的基础上新增Xi引起的回归平和的增加量。用SS回(Xi)表示。

F检验

[
F=\frac{SS_{回}(X_{i})/1}{SS_{残}/(n-m-1)}
]

t检验

和F检验的结果是一致的,其公式为
[
t_{i}=\frac{b_{i}}{S_{b_{i}}}
]
其中,$b_{i}$为偏回归系数的估计值,$S_{b_{i}}$为$b_{i}$的标准误计算比较复杂,自由度为n-m-1。

R语言中各偏平和检验的p值

summary(line.model)$coef
##               Estimate Std. Error    t value   Pr(>|t|)
## (Intercept)  5.9432678  2.8285899  2.1011416 0.04730765
## x1           0.1424465  0.3656530  0.3895674 0.70060210
## x2           0.3514655  0.2042042  1.7211469 0.09925903
## x3          -0.2705853  0.1213938 -2.2289878 0.03634597
## x4           0.6382012  0.2432644  2.6234880 0.01551557

倒数最后两列分别是t统计量和p值

标准化回归系数

由于自变量单位不同,难以从偏回归系数的大小分析其各自的影响程度。

变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差,计算得到的回归方程称作标准化回归方程,相应的回归系数即为标准化回归系数

标准化回归系数没有单位,可以用来比较各个自变量Xi对Y的影响强度,通常在有统计学意义的前提下,标准化回归系数的绝对值愈大说明相应自变量对Y的作用愈大。

一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时, 增加或减少一个单位时Y的平均变化量。不能用各偏回归系数来比较各自变量对Y的影响大小。

标准化回归系数无单位,用来比较各自变量对应变量的影响大小,偏回归系数越大,Xi对Y的影响越大。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,491评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,856评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,745评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,196评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,073评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,112评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,531评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,215评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,485评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,578评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,356评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,215评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,583评论 3 299
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,898评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,174评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,497评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,697评论 2 335

推荐阅读更多精彩内容