08 特征工程 - 特征降维 - IDA 数据清洗常见流程 异常数据处理 案例 - 车辆数据预处理 每个样本具有7个特征,描述如下:• 购买价格...
线性判断分析(LDA): LDA是一种基于分类模型进行特征属性合并的操作,是一种有监督的降维方法。 LDA原理 LDA的全称是Linear Di...
06 特征工程 - 特征选择 特征降维必须在特征选择做完以后才能进行。 当特征选择完成后,可以直接可以进行训练模型了,但是可能由于特征矩阵过大,...
05 特征工程 - 缺省值填充 当做完特征转换后,实际上可能会存在很多的特征属性,比如:多项式扩展转换、文本数据转换等等,但是太多的特征属性的存...
04 特征工程 - 特征转换 - 文本特征属性转换 缺省值是数据中最常见的一个问题,处理缺省值有很多方式,主要包括以下四个步骤进行缺省值处理: ...
03 特征工程 - 特征转换 - 分词、Jieba分词 机器学习的模型算法均要求输入的数据必须是数值型的,所以对于文本类型的特征属性,需要进行文...
02 特征工程 - 数据不平衡 特征转换主要指将原始数据中的字段数据进行转换操作,从而得到适合进行算法模型构建的输入数据(数值型数据),在这个过...
01 特征工程 - 概念 数据清洗过程: PS:工作中可能遇到的最大的问题是数据不均衡。怎么去解决的? 上采样、下采样、SMOTE算法。解决的效...
实际上特征工程是一个面向十分广的概念,只要是在处理数据就可以认为是在做特征工程。个人理解中,真正意义上的特征工程还是数据降维和数据升维的过程。 ...
文集作者