二.维度建模技术

一.基本概念

1.收集业务需求与数据实现

理解业务需求。

2.协作维度建模研讨

维度模型应由主题专家与企业数据管理代表合作设计而成。

3.维度设计4步骤

维度模型设计期间涉及4个主要决策:
(1)选择业务过程
(2)声明粒度
(3)确认维度
(4)确认事实

4.业务过程

业务过程是组织完成的操作型活动,比如,获得订单。

5.粒度

粒度用于确定某一事实表中的行表示什么。

6.描述环境的维度

维度表时数据仓库的“灵魂”。

7.用于度量的事实

事实涉及来自业务过程事件的度量,基本都以数量值表示。

二.事实表技术基础

1.事实表结构

事实表设计完全依赖于物理活动,不受可能产生的最终报表的影响。
查询请求的主要目标是针对事实表开展计算和聚集操作。

2.可加、半可加、不可加事实

事实表中的数字度量可划分为三类:可加是最有用的,可以按照与事实表关联的任意维度汇总;半可加可以对某些维度汇总;不可加的,比如,比率。

3.事务事实表

事务事实表的一行对应空间或时间上某点的度量事件。

4.周期快照事实表

周期快照事实表中的每行汇总了发生在某一标准周期,如一天,一月的多个度量事件。

5.累积快照事实表

累积快照事实表的行汇总了发生在过程开始和结束之间可预测步骤内的度量事件。

6.聚集事实表

聚集事实表是对原子粒度事实表进行简单的数字化上卷操作,目的是为了提高查询性能。

三.维度表技术基础

1.维度表结构

每个维度表都包含单一的主键列。通常较宽,包含大量低粒度的文本属性。

2.维度代理键

维度表中会包含一个列,表示唯一主键,该主键不是操作型系统的自然键,而是按顺序分配的简单整数,从1开始,每当需要新建时,自动加1。

3.多层次维度

多数维度包含不只一个自然层次。例如,日历日期维度可以按照财务周期层次从天到周划分。

4.维度表中的空值属性

推荐采用描述性字符串替代空值。例如,Unknown。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 0x00 前言 我们知道维度建模是使用一致性维度来串联整个数据仓库,按照kimball的维度建模理论,维度模型设计...
    曹操a阅读 4,282评论 0 1
  • 事实表技术简述 事实表结构1,总是包含外键,且外键不能唯空。2,事实表的设计完全依赖业务活动,不受最终报表的影响。...
    数据僧阅读 13,401评论 0 9
  • 本书是阿里巴巴分享描述了按照其公司业务的一些大数据技术实施的方案,是阿里巴巴对大数据的认知。其中也有很多值得学习的...
    yuppy_zyp阅读 12,441评论 0 12
  •  数据建设,解决的目标就是从数据源头到数据价值实现的全链路工作,我们把这个链路比作有机蔬菜的商业化实现。那么,数据...
    别停下思考阅读 9,222评论 0 3
  • 如果可能,或许每个人心中都想回到早已回不去的童年,那些时光是美好而又快乐的,与如今忙于工作之中的人们来说,除了奢望...
    邂逅君阅读 2,994评论 0 3