1.线性拟合常用函数
除了summary函数还有一些用来查看拟合程度的结果
图1 线性拟合常用函数
1.1 coefficients函数
接着用上节women的线性回归结果,也可以简写为coef(fit)
coefficients(fit)
图2 coefficients函数结果
1.2 confint函数
接着用上节women的线性回归结果
confint(fit)
图3 confint函数结果
1.3 fitted函数
接着用上节women的线性回归结果,fitted用于计算预测值。
fitted(fit)#根据height值通过预测函数计算预测值
women$weight-fitted(fit)#计算残差
图4 fitted函数结果
1.4 residuals函数
接着用上节women的线性回归结果。
residuals(fit)#计算残差
图5 residuals函数计算结果
1.5 predict函数
predict函数用拟合结果对新数据进行预测,第一次参数是拟合结果,第二个参数是新数据,接着用上节women的线性回归结果。
predict(fit,women1)#根据拟合结果对新数据进行预测
图6 predict函数计算结果
2. 绘图
2.1 plot绘图
plot函数对lm拟合的结果进行绘图,一共绘制四幅图残差拟合图,正态QQ图,大小位列图以及残差影响图。
plot(fit)
第一幅图用来表示因变量与自变量是否呈线性关系,图中的点是残差的分布,曲线为拟合曲线。
图7 残差拟合图
第二幅图是用来描述正态性的QQ图,如果数据呈正态分布,则在QQ图中就是一条直线,图中残差值也是呈直线分布。这就说明满足了正态性的要求。
图8 正态QQ图
第三幅图是位置与尺寸图,用来描述同方差性,如果满足不变方差的假设,那么图中水平线周围的点应该是随机分布的,这个图满足条件。
图9 大小位列图
第四幅图是残差与杠杆图,提供了对单个数据集的观测。从图中可以看到哪个点偏差较远,可以用来鉴别离群点,高杠杆点和强影响点。
- 离群点表示回归模型对这个点的预测效果不好,残差值比较大,不适合模型。
- 高杠杆点表示异常的预测变量的组合
-
强影响点表示这个值对模型参数的估计产生的影响过大,可以用cook's distance来鉴别
图10 残差影像图
2.2 abline绘图
abline是绘制出拟合曲线,他需要数据集的散点图上再进行操作,所以就必须要先绘制散点图,再绘制拟合曲线。
plot(women$height,women$weight)
abline(fit)
图11 拟合曲线图