最重要的是看ROI
质量评估
差距分析
- 与benchmark的差距
- 不同利益方的角色差距 - 如数据管理者和数据消费者。用于判断角色差距是否是基准差距的来源之一。
完整性约束 - P43
对于大多数简单的比例指标,建议使用
数据质量指标 - P44
- 列了一堆衡量整体数据的指标
- 嵌入过程的数据整体性方法 - P52 表4.1
抽样方法
抽样过程 - P57
- 简单随机抽样
- 系统抽样
- 分层随机抽样
- 聚类抽样
数据质量问题模式剖析
数据质量问题的表现
P75 表6.1 十大根源的积极和负面表象