数据挖掘的基本任务:
分类与预测、聚类分析、关联规则、时序模式、偏差检测、智能推荐
数据挖掘建模过程:
1)定义挖掘目标
2)数据取样:定义数据挖掘目标之后,从业务系统中抽取出一个与挖掘目标相关的样本数据子集。取样方式:随机抽样,等距抽样(每隔一段距离抽取一个样本),分层抽样,从起始顺序抽样,分类抽样。
3)数据探索:异常值分析、缺失值分析、相关分析和周期分析等。
4)数据预处理:降维、缺失值处理。主要包括:数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约。
5)挖掘建模:选用合适的算法进行建模
6)模型评价
第一章 数据挖掘基础
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。
推荐阅读更多精彩内容
- 机器学习里有一句名言:数据和特征决定了机器学习的上限,而模型和算法的应用只是让我们逼近这个上限。这个说法形象且深刻...
- 注:题中所指的『机器学习』不包括『深度学习』。本篇文章以理论推导为主,不涉及代码实现。 前些日子定下了未来三年左右...