本次分享几个容易混淆的量,分别为:
RMS:均方根值
RMSE: 均方根误差
Standard Deviation: 标准差
下面给出三个量的表达公式:
均方根值
$$X_{rms} = \sqrt{ \frac{\sum_{i=1}^{N} X_{i}^{N}} {N}} = \sqrt{\frac{X_{1}^{2} +X_{2}^{2}+ ...+X_{N}^{2}} {N}}$$
均方根误差
$$RMSE = \sqrt{\frac{\sum_{i=1}^{n} (X_{obs,i} - X_{model,i})^{2}}{n}}$$
公式理解: 它是观测值与真值偏差的平方和观测次数$n$比值的平方根,在实际测量中,观测次数$n$总是有限的,真值只能用最可信赖(最佳)值来代替.方根误差对一组测量中的特大或特小误差反映非常敏感,所以,均方根误差能够很好地反映出测量的精密度。均方根误差,当对某一量进行甚多次的测量时,取这一测量列真误差的均方根差(真误差平方的算术平均值再开方),称为标准偏差,以$\sigma$表示。$\sigma$反映了测量数据偏离真实值的程度,$\sigma$越小,表示测量精度越高,因此可用$\sigma$作为评定这一测量过程精度的标准。
标准差:
$$SD = \sqrt{\frac{sum_{i=1}^{N} (X_{i} - \overline{X})^{2}}{n}}$$
理解: 标准差是方差的算术平方根,也称均方差($Mean$ $ Square$ $ Error$),是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用$\sigma$表示,标准差能反映一个数据集的离散程度。
在机器学习训练模型时,$MSE$ 是最常用的,用来刻画模型的误差。