2019-07-19

退化维度

在大数据的事实表模型设计中,更多的是考虑提高下游用户的使用效率,降低数据获取的复杂性,减少关联的表数量。

特点

1.数据不断更新

2.多业务过程日期

特殊处理

1.非线性过程

针对非线性过程,处理情况主要有以下几种。

(1)业务过程的统一

(2)针对业务关键里程碑构建全面的流程

(3)循环流程的处理

主要问题是解决一个业务过程存在多个里程碑日期的问题。使用业务过程第一次发生的日期还是最后一次发生的日期,决定权在商业用户,而不是设计或者开发人员。

2.多源过程

3.业务过程取舍

4.物理实现

逻辑模型和物理模型密不可分。

第一种方式是全量表的形式。

第二种是全量表的变化形式。

第三种方式是以业务实体的结束时间分区。

使用相关业务系统的业务实体的结束标志作为此业务系统的结束标志。

和前端业务系统确定口径或使用前端归档策略。和前端业务系统确定口径,确定从业务实体的产生到消亡的最大间隔。另外,针对大量的事实数据,前端系统会定期对历史数据进行归档,避免业务库性能的下降,对于这种情况,可以使用前端系统的归档时间作为业务实体的结束日期。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容