在获取样本时,样本的取值范围过大的时候,如果数据未处理的话,在应用梯度下降算法寻找全局最小值的时候,代价函数需要花费巨大的代价。
当对特征进行缩放的时候,减小样本的变化范围,特征缩放有时能提高算法的收敛速度,代价函数花费代价更少,计算更快。
一般的:
将特征值约束在-1《 x 《1的范围内。
-1到1这个范围不是固定的,只要范围距离不是过大或者太小,都是合适的,
因此,你可以根据自身需要定义范围为:
(-3,3)
(-1/3,1/3)
之类典型距离,都是可以的
例如:
当特征x的取值为:0-2000之间,我们可以进行特征缩放
x = 345/2000
x = 565/2000
这个样子,我们就可以将特征变化范围约束到(0,1)之间