一旦确定低劣数据质量确实会对有任务运营方式产生负面影响,那么就有必要为建立数据质量管理计划并开始改进时间而进行方法规划。
规划时必须考虑:
1.需要实施的流程
2.参与执行流程的人员以及其角色和职责
3.用于支撑流程的工具
2.1数据良性循环
步骤:
第一步:实践者视图了解低劣数据质量影响业务流程计划运转方式的范围;
调查、记录、查找根源、利用数据统计分析工具和技术(如数据剖析)识别潜在的供业务专家审核的数据异常
第二步;定义业务相关的数据质量规则以及绩效目标;
识别数据质量规则和可接受阈(yù )值,并根据规则制定相关数据测量方法
第三步:设计纠正流程缺陷的质量改进流程;
如果没有达到可接受阈值,将重新审核。数据质量问题按照严重程度以及纠正的可行性进行排序,制定行动计划并选择设计方案
第四步:实施质量改进方法与流程;
实施设计好的方案,纠正可能包括更正、检查和通知,也包括对员工有关业务流程改进方面的培训
第五步:对照目标监控数据质量;
数据质量分析师审查数据达到或未达到可接受阈值的程度。如果有问题需要在研究就会通知数据管理专家并启动单独的解决流程。同时又回到循环的开始。
总结:前两步属于分析类任务,评价目标数据集并分析出是否存在影响业务的严重错误;后三步属于执行类任务,将着手制定计划和按计划执行放在一起。
此五步构成了一个可以重复的流程,用于积累有助于构成数据质量记分卡和数据质量仪表板的数据质量指标,同时这也有利于推动主动数据质量管理
2.2数据质量流程
第一步:业务影响分析,数据质量需求分析,自底向上的数据质量评价,自顶向下的数据质量评价
第二步:定义质量测量方法,业务数据用户参与,定义测量指标,可接受阈值
第三步:数据标准,元数据管理,数据有效性规则,将数据质量设计到系统中
第四步:数据纠正,流程纠正,标准化与清理,身份分辨,数据增强,管理数据纠正,根本原因分析
第五步:检测与检测,数据质量服务水平协议,数据质量事件与绩效报告