data(snake); //引入数据集
dim(snake);//查看数据集的维度
str(snake);//查看数据集详情,head,tail,mean,max,min...
names(snake) <- c("content","yield");//为数据集的每列设置别名
attach(snake);//执行后可直接使用数据集别名
cor(snake);//查看数据集每列的相关性系数
cov(snake);//查看数据集每列的协方差
plot(snake);//查看数据分布情况
yield.fit <- lm(yield~content);//执行一元线性回归
yield.fit;//查看线性回归结果
plot(yield.fit);//查看线性回归结果
summary(yield.fit);//查看线性回归汇总
上图中,Intercept指截距,content指系数,即模型结果是yield=0.4981*content+0.7254
上面是线性回归模型的汇总结果,重点关注划线的几个地方,解释如下:
1.Residuals是指模型残差,原则上应该符合正态分布,1Q应该与3Q差不多
2.Pr(>|t|用于描述系数显著性,越小越好,一般应小于0.05,约小说明模型系数越有效
3.Adjusted R-squared:说明模型拟合程度,越大说明拟合的越好,原则上应大于0.80
4.F统计的p-value也是描述模型显著性,越小越好,应低于0.05
同时满足上面几个条件可以说明,这个结论是可以接受的。