《数据质量征途》

最重要的是看ROI

质量评估

差距分析

  1. 与benchmark的差距
  2. 不同利益方的角色差距 - 如数据管理者和数据消费者。用于判断角色差距是否是基准差距的来源之一。

完整性约束 - P43

对于大多数简单的比例指标,建议使用

数据质量指标 - P44

  1. 列了一堆衡量整体数据的指标
  2. 嵌入过程的数据整体性方法 - P52 表4.1

抽样方法

抽样过程 - P57

  1. 简单随机抽样
  2. 系统抽样
  3. 分层随机抽样
  4. 聚类抽样

数据质量问题模式剖析

数据质量问题的表现

P75 表6.1 十大根源的积极和负面表象

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容