R01:一元线性回归

data(snake); //引入数据集

dim(snake);//查看数据集的维度

str(snake);//查看数据集详情,head,tail,mean,max,min...

names(snake) <- c("content","yield");//为数据集的每列设置别名

attach(snake);//执行后可直接使用数据集别名

cor(snake);//查看数据集每列的相关性系数

cov(snake);//查看数据集每列的协方差

plot(snake);//查看数据分布情况

yield.fit <- lm(yield~content);//执行一元线性回归

yield.fit;//查看线性回归结果

plot(yield.fit);//查看线性回归结果

summary(yield.fit);//查看线性回归汇总


cor


rplot




yield

上图中,Intercept指截距,content指系数,即模型结果是yield=0.4981*content+0.7254


summary

上面是线性回归模型的汇总结果,重点关注划线的几个地方,解释如下:

1.Residuals是指模型残差,原则上应该符合正态分布,1Q应该与3Q差不多

2.Pr(>|t|用于描述系数显著性,越小越好,一般应小于0.05,约小说明模型系数越有效

3.Adjusted R-squared:说明模型拟合程度,越大说明拟合的越好,原则上应大于0.80

4.F统计的p-value也是描述模型显著性,越小越好,应低于0.05


同时满足上面几个条件可以说明,这个结论是可以接受的。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容