元数据

1.元数据的定义:

元数据是关于数据的数据,元数据打通了源数据、数据仓库、数据应用、记录了数据从产生到消费的全过程。元数据主要记录数据仓库中魔性的定义、各层级间的映射关系、监控数据仓库的数据状态及ETL的任务运行状态。在数据仓库系统中,元数据可以帮助数据仓库管理员和开发人员非常方便地找到他们所关心的数据,用于指导其进行数据管理和开发工作,提高工作效率。 --《大数据之路》

元数据又分为技术元数据和业务元数据两大类:

  • 技术元数据:Hive的表结构信息分区信息等,MapReduce任务执行信息,oozie,宙斯,阿兹卡班任务的运行信息,依赖信息
  • 业务元数据:数据报表的口径定义,指标清洗规则等,用来解释某些业务流程或者指标的由来

2.元数据价值

元数据最重要的应用价值是数据管理、数据内容、数据应用的基础,在数据管理方面为集团数据提供在计算、存储、成本、质量、安全、模型等治理领域上的数据支持。 --《大数据之路》

元数据对应用链路分析和数据建模还有驱动ETL开发方向非常重要。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。