为什么需要对数值类型的特征做归一化？

数字类型的各特征取值尺度范围可能不同，不同特征的取值范围可能不同，变化程度可能不同，归一化化会规避掉这种情况，使各特征都统一到一个大致相同的区间内。

常用的特征归一化方法有，线性函数归一化（Min-Max Scaling）、零均值归一化（Z-score Normalization）

通过梯度下降法求解的模型通常是需要归一化的，如线性回归、逻辑回归、支持向量机、神经网络等；但对于决策树模型则并不适用，决策树模型在分裂节点时，考虑的是数据集关于X的信息增益比，而信息增益比与特征是否经过归一化无关，因为归一化不会改变数据在特征X上的信息增益。

最后编辑于：2019.03.21 10:20:57

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。