实习结束后补一下数据分析概念相关知识: 第三章 第四章 数据挖掘建模过程 定义挖掘目标 数据取样 抽取一个与目标相关的样本数据子集。 抽取数据的标准:相关性、可靠性、有效性 衡量数据质量的标准:完整无缺、指标齐全、反应正常状态下的水平 抽样的常见方式:随机抽样、等距抽样、分层抽样、从起始顺序抽样、分类抽样 数据探索 主要包括:异常值分析、缺失值分析、相关分析、周期性分析 数据预处理 数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约 挖掘建模 模型评价 ——> 第三章