随着企业数据不断膨胀,数据间构成了一张极为复杂的加工关系网图。如果数据出现了错误,如何快速的锁定引发问题的原因,如何发现哪些实体会受到影响。
通过本认证学习,学员可掌握数据仓库元数据的应用及核查方法,通过记录核查表,利用元数据,分析数据产生问题的原因,制定解决方案,提升数据质量。
课程附带实验案例说明:
某网商公司搭建的数据平台,数据从底层仓库进行多层加工至展示层,最终发现加工后的数据存在数据质量问题,现需使用MaxCompute的元数据血缘分析,可以有针对性的进行数据追踪,对数据质量问题进行分析,一层一层追至产生数据问题的点,最终解决数据质量问题。
内容列表
01元数据定义及功能 介绍什么是元数据,元数据的分类,元数据的功能、作用。
02元数据管理设计方法及案例 介绍如何搭建数据仓库元数据系统。
03阿里云相关产品介绍 介绍本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
04阿里云相关产品基本操作演示 演示本课程中用到的阿里云产品大数据计算服务和大数据开发套件。
05某数据分析系统利用元数据管理数据质量 介绍项目背景、项目实施流程以及其中的关键步骤和技术。
06【在线实验】利用元数据管理数据质量 使用DataIDE中的元数据相关功能,分析数据质量,
寻找数据产生差异的原因并进行修正,最终生成正确的汇总数据。