机器学习回归模型的评价方法
1 均方误差(mean squared error,mse)
1.定义:观察值与真实值偏差的平方和与观察次数的比值,
2.公式:
3.描述:这就是线性回归中最常用的损失函数,线性回归过程中尽量让该损失函数最小。那么模型之间的对比也可以用它来比较。MSE可以评价数据的变化程度,MSE的值越小,说明预测模型描述实验数据具有更好的精确度。
2 标准误差(rmse)
- 定义:标准差是方差的算术平方根,标准误差是均方误差的算术平方根。
- 描述标准差是用来衡量一组数自身的离散程度,而均方根误差是用来衡量观测值同真值之间的偏差,它们的研究对象和研究目的不同,但是计算过程类似。
- 公式
- 它的意义在于开个根号后,误差的结果就与数据是一个级别的,可以更好地来描述数据。标准误差对一组测量中的特大或特小误差反映非常敏感,所以,标准误差能够很好地反映出测量的精密度。这正是标准误差在工程测量中广泛被采用的原因。
3 平均绝对误差(MAE)
1 公式
2 平均绝对误差能更好地反映预测值误差的实际情况
4 R-squared
- 公式
其中
- 解释
上面分子就是我们训练出的模型预测的误差和。
下面分母就是瞎猜的误差和。(通常取观测值的平均值) - 变形
5 解释方差(explained variance score)
- 公式
- 解释
可解释方差指标衡量的是所有预测值和样本之间的差的分散程度与样本本身的分散程度的相近程度。本身是分散程度的对比。最后用1-这个值,最终值越大表示预测和样本值的分散分布程度越相近