Data Vault 2.0方法论简介

Data Vault 2.0方法论

Data Vault 2.0标准为项目执行提供了一个最佳实践,称为“Data Vault 2.0方法论”。它来源于核心软件工程标准,并对这些标准进行了调整,以用于数据仓库。图3.1显示了影响Data Vault 2.0方法论的标准。

图3.1 Data Vault 2.0方法论的标准

图3.1 Data Vault 2.0方法论的标准

通过结合这些标准,Data Vault 2.0方法论成为数据仓库中项目管理的最佳标准。Scrum用于团队协作,并应用于项目的日常任务。在两到三周的Scrum迭代(sprint冲刺)中,团队执行一个基于软件开发生命周期(SDLC)的小型瀑布。目标是在此迭代之后完成可交付的内容,这些内容可以投入到生产中。

PMI项目管理知识体系(PMBOK)是项目管理专业人员(PMP)认可的项目管理技术,用于定义和执行项目的物理层面的项目计划。能力成熟度模型集成(CMMI)用于全面管理和项目监督,并应用于评审和改进会议。

在闭环方法中使用全面质量管理(TQM)对流程和基础数据进行持续改进。当业务用户涉及到调整跨源的数据集和纠正源系统中的错误时,他们会遵循我们将在后续文章讨论的TQM原则,这需要比只关注数据质量(DQ)的常用方法更多的活动。

六西格玛规则和原则的应用是为了在构建和实施Data Vault 2.0风格的数据仓库计划的过程中实现敏捷性的最大优化。这个过程依赖于测量(估计vs实际),或者关键性能指标(kpi),在后续文章中介绍。

Data Vault 2.0方法论包括三种主要的活动,在这些活动中应用了图3.1所示的方法:

  1. 项目计划,包括对项目的管理、定义和评估;
  2. 项目执行,包括sprint定义、团队组织和工件组织的技术编号;
  3. 评审和改进,包括评审和改进活动。

后续文章再详细描述了这些活动和方法的应用。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • Data Vault 2.0架构 Data Vault 2.0架构解决了上一节定义的可扩展性和可伸缩性维度,方法是...
    DataVault善哉阅读 1,543评论 0 2
  • 企业数据仓库环境 企业数据仓库(EDW)是从普通数据仓库演变而来的,它们已在上篇文章[https://www.ji...
    DataVault善哉阅读 584评论 0 1
  • 对比传统的基于 RDBMS 之上的数据仓库和商业智能项目,尝试着说说,Hadoop 之上的数据仓库,从ETL, 数...
    LifePassenger阅读 4,557评论 0 5
  • 大数据学习交流群:808769635 前段时间有报道称,有学者质疑“大数据”理论,也有硅谷公司负责人质疑大数据应用...
    顺治帝阅读 3,268评论 0 5
  • 数据仓库领域,在业界有几位公认大牛, 第一位 William H. (Bill) Inmon, 数据仓库之父,开山...
    长较瘦阅读 766评论 0 0