登录注册写文章

特征工程——特征归一化

特征工程——特征归一化

在现实生活中，我们需要处理的数据大部分的量纲都是不一样的，如果不做归一化的话就会会出现的问题是，不同量纲的数据在梯度下降过程中下降的速度是不一样的， $\color{red}{这个过程需要多次迭代才能找到最优解}$ 但是如果数据都是同一量纲下的数据的话，找到最优解的迭代次数会少很多，容易更快找到最优解。

所以数据需要归一化

在实际应用过程中呢并不是所有的模型都需要归一化，比如需要梯度下架的模型是比较需要

线性回归
逻辑回归
各种神经网络
支持向量机

但是决策树却不需要，这是因为数据归一化，并不能改变数据信息增益比，对决策并没有帮助。

归一化的方法：

分为两种：

通过线性函数的归一化

$X_n = \frac{X-X_{min}}{X_{max}-X_{min}}$

零均值归一化

其实就是化为标准正太分布，感觉是一个意思反正哈哈😀
假设原始特征值为 $\mu$ ,标准差为 $\sigma$

$z = \frac{x-\mu}{\sigma}$

大概就是这样了，再多的我也不知道了

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

自然语言处理神经网络模型入门
主要内容自然语言输入编码前馈网络卷积网络循环网络(recurrent networks ) 递归网络(re...
JackHorse阅读 4,514评论 0赞 2
机器学习术语表
机器学习术语表本术语表中列出了一般的机器学习术语和 TensorFlow 专用术语的定义。 A A/B 测试 (...
yalesaleng阅读 2,160评论 0赞 11

均一化和标准化
数据的标准化（normalization）和归一化数据的标准化（normalization）将数据按比例缩放，...
单细胞空间交响乐阅读 15,844评论 0赞 7
归一化（Normalization）、标准化（Standardization）和中心化/零...
1 概念归一化：１）把数据变成(０，１)或者（1,1）之间的小数。主要是为了数据处理方便提出来的，把数据映射到...
brucep3阅读 518,619评论 7赞 135
机器学习之归一化/标准化
这篇关于归一化的文章是最近学习的一个总结，放在简书上，方便日后查阅。一、前言此篇博文首先说明了什么是归一化，接...
就是杨宗阅读 9,463评论 4赞 5

友情链接更多精彩内容

赞1赞

赞赏

手机看全文