特征归一化

归一化:数据转化为[0,1]之间的数,例如先行归一化Xnorm = (X-Xmin)/(Xmax - Xmin)

标准化:数据转化为期望为0,方差为1的数,例如Xnorm = (X - \mu ) / \sigma

中心化:数据转化为0均值

目的:1)对于基于梯度优化方法求解更快,例如svm,logistic回归,线性回归,神经网络,对于决策树模型,使得各参数更新速度一致,避免更新路径Z字形。由于其节点分裂主要依据信息增益,信息增益比,gini指数等,归一化并不会改变这些数值,所以没有作用

2)避免某些数值过大引发计算问题

3)无量纲化,平衡各个数据之间的重要性,避免某些特征被其他特征淹没。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容