归一化:数据转化为之间的数,例如先行归一化
标准化:数据转化为期望为0,方差为1的数,例如
中心化:数据转化为0均值
目的:1)对于基于梯度优化方法求解更快,例如svm,logistic回归,线性回归,神经网络,对于决策树模型,使得各参数更新速度一致,避免更新路径Z字形。由于其节点分裂主要依据信息增益,信息增益比,gini指数等,归一化并不会改变这些数值,所以没有作用
2)避免某些数值过大引发计算问题
3)无量纲化,平衡各个数据之间的重要性,避免某些特征被其他特征淹没。
归一化:数据转化为之间的数,例如先行归一化
标准化:数据转化为期望为0,方差为1的数,例如
中心化:数据转化为0均值
目的:1)对于基于梯度优化方法求解更快,例如svm,logistic回归,线性回归,神经网络,对于决策树模型,使得各参数更新速度一致,避免更新路径Z字形。由于其节点分裂主要依据信息增益,信息增益比,gini指数等,归一化并不会改变这些数值,所以没有作用
2)避免某些数值过大引发计算问题
3)无量纲化,平衡各个数据之间的重要性,避免某些特征被其他特征淹没。