为什么需要对数值类型的特征做归一化?

数字类型的各特征取值尺度范围可能不同,不同特征的取值范围可能不同,变化程度可能不同,归一化化会规避掉这种情况,使各特征都统一到一个大致相同的区间内。

常用的特征归一化方法有,线性函数归一化(Min-Max Scaling)、零均值归一化(Z-score Normalization)

通过梯度下降法求解的模型通常是需要归一化的,如线性回归、逻辑回归、支持向量机、神经网络等;但对于决策树模型则并不适用,决策树模型在分裂节点时,考虑的是数据集关于X的信息增益比,而信息增益比与特征是否经过归一化无关,因为归一化不会改变数据在特征X上的信息增益。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

友情链接更多精彩内容