Avatar notebook default
9篇文章 · 11970字 · 2人关注
  • Resize,w 360,h 240
    09 特征工程 - 总结

    08 特征工程 - 特征降维 - IDA 数据清洗常见流程 异常数据处理 案例 - 车辆数据预处理 每个样本具有7个特征,描述如下:• 购买价格...

    0.7 538 0 12
  • Resize,w 360,h 240
    08 特征工程 - 特征降维 - LDA

    线性判断分析(LDA): LDA是一种基于分类模型进行特征属性合并的操作,是一种有监督的降维方法。 LDA原理 LDA的全称是Linear Di...

    1.3 2460 0 21
  • Resize,w 360,h 240
    07 特征工程 - 特征降维 - PCA

    06 特征工程 - 特征选择 特征降维必须在特征选择做完以后才能进行。 当特征选择完成后,可以直接可以进行训练模型了,但是可能由于特征矩阵过大,...

    1.6 3576 0 24
  • Resize,w 360,h 240
    06 特征工程 - 特征选择

    05 特征工程 - 缺省值填充 当做完特征转换后,实际上可能会存在很多的特征属性,比如:多项式扩展转换、文本数据转换等等,但是太多的特征属性的存...

    2.0 1807 1 28
  • Resize,w 360,h 240
    05 特征工程 - 缺省值填充

    04 特征工程 - 特征转换 - 文本特征属性转换 缺省值是数据中最常见的一个问题,处理缺省值有很多方式,主要包括以下四个步骤进行缺省值处理: ...

    6.8 2404 0 23
  • Resize,w 360,h 240
    04 特征工程 - 特征转换 - 文本特征属性转换

    03 特征工程 - 特征转换 - 分词、Jieba分词 机器学习的模型算法均要求输入的数据必须是数值型的,所以对于文本类型的特征属性,需要进行文...

    1.7 2407 0 25
  • Resize,w 360,h 240
    03 特征工程 - 特征转换 - 分词、Jieba分词

    02 特征工程 - 数据不平衡 特征转换主要指将原始数据中的字段数据进行转换操作,从而得到适合进行算法模型构建的输入数据(数值型数据),在这个过...

    1.1 1638 0 18
  • Resize,w 360,h 240
    02 特征工程 - 数据不平衡

    01 特征工程 - 概念 数据清洗过程: PS:工作中可能遇到的最大的问题是数据不均衡。怎么去解决的? 上采样、下采样、SMOTE算法。解决的效...

    2.6 4318 1 35
  • Resize,w 360,h 240
    01 特征工程 - 概念

    实际上特征工程是一个面向十分广的概念,只要是在处理数据就可以认为是在做特征工程。个人理解中,真正意义上的特征工程还是数据降维和数据升维的过程。 ...

    2.3 2688 0 24

文集作者