数据预处理

机器学习输入的特征数据进行训练时需要进行标准化、归一化,使数据的分布符合正态分布模型(生活中多数数据都是此模型),或者与与参数相符合的模型分布,一般是把数据缩放到[0,1]或者[-1,1]之间,如果数据有缺失,还需要填补缺失的数据。详情请见:数据预处理最要使用的方法有几大类:

  • 绝对值最大值法
    (找出参数的最大值,然后使用参数集合中的数除以此最大值)
  • 最小最大值法
  • 参数编码法
  • 数据降维(PCA和SVD分解)
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 前提 在数据挖掘中,海量的原始数据中存在大量不完整(有缺失值)、不一致、有异常的数据,会严重影响到数据挖掘建模的执...
    神奇的考拉阅读 2,043评论 0 3
  • Dataset transformations| 数据转换 Combining estimators|组合学习器 ...
    houhzize阅读 4,380评论 0 4
  • 一、引述 低质量的数据导致低质量的数据挖掘结果,因此需要对数据进行预处理,提高数据质量,提高数据挖掘结果。预处理技...
    FreeLuo阅读 2,033评论 0 1
  • 我是一个在家呆了7年的全职妈妈 有人说七年就是一辈子 那我就做了一辈子的妈妈 做妈妈有痛楚、也有欢乐 从而有了我超...
    王五月阅读 336评论 0 1
  • 30 机场到明洞 5B 11B 巴士:6001;6015 31 爱宝乐园 。普信阁倒数:地铁1号线 钟阁站 4出口...
    pumpkinchanchan阅读 347评论 0 0