《Python数据分析与挖掘实战(张良均等)》笔记

实习结束后补一下数据分析概念相关知识:
第三章
第四章

数据挖掘建模过程

  1. 定义挖掘目标
  2. 数据取样
    抽取一个与目标相关的样本数据子集。
    抽取数据的标准:相关性可靠性有效性
    衡量数据质量的标准:完整无缺指标齐全反应正常状态下的水平
    抽样的常见方式:随机抽样、等距抽样、分层抽样、从起始顺序抽样、分类抽样
  3. 数据探索
    主要包括:异常值分析、缺失值分析、相关分析、周期性分析
  4. 数据预处理
    数据筛选、数据变量转换、缺失值处理、坏数据处理、数据标准化、主成分分析、属性选择、数据规约
  5. 挖掘建模
  6. 模型评价

——> 第三章

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 对于R语言的学习是在某位知乎大V的推荐下开始的,自己之前的学习不管是针对数据分析,数据挖掘还是机器学习,都是基于P...
    橘子侠阅读 4,251评论 0 2
  • 机器学习里有一句名言:数据和特征决定了机器学习的上限,而模型和算法的应用只是让我们逼近这个上限。这个说法形象且深刻...
    3b899188980c阅读 3,330评论 0 3
  • 《医疗革命》的读书笔记 作 者:邵学杰 出版社:中信出版社 版 次:2016年9月第1版 作者简介: 邵学杰:我国...
    格式化_001阅读 2,068评论 2 4
  • 现在写日记开始觉得是一件很low的事情,也有可能是因为在上班这个不合时宜的时候写有莫大的关系,总觉得对不起工作对不...
    陆壹玖阅读 398评论 0 0
  • 大学同学买了新车,于是上上周末我临时做了回指导老师,坐在副驾位置“指点江山”了一番。其实,这也就是熟练工,没啥花头...
    Amy娴阅读 177评论 0 0

友情链接更多精彩内容