首先,如果特征集只包含一个特征值时,缩放所带来的好处微乎其微或根本没有。当特征集包含多个特征时,缩放能带来以下好处:
1. 帮助梯度下降法更快速的收敛。
2. 帮助避免 “NaN” 陷阱。模型中的一个数值变成 NaN(例如,当某个值在训练期间超出浮点精确率限制时),模型中的所有其他数值最终也会因数学运算而变成 NaN。
3. 帮助模型为每个特征确定合适的权重。如果没有进行特征缩放,则模型会对范围较大的特征投入过多精力。
方法1:
scaledvalue = (value - mean) / stddev
方法2:
scaledvalue = (value - min) / (max - min)