数据汇集-数据汇集范围

整体思路

数据仓库建设的第一步即数据汇集。
在数据汇集时总要先明确数据要同步的范围。一般情况下,只有有意义的数据才会进行汇集。有意义的数据即:
1.有真实的业务含义
2.可以正确的反应业务事实
3.在业务时间范围之内
由以上可得不需要进行数据汇集的数据主要有:
1.配置数据
2.归档数据
3.加工过程中产生的临时数据
举个例子,在数据库中的带有sys、temp、log类型的数据一般是不用进行数据汇集的。
说完了不需要汇集的数据,再说一些数据库中原本不存在但是需要汇集到数据仓库中的数据。这样的数据有各种国标、行标以及数据库中本已有的维表,需要经过摸排以后将摸排的结果添加到数据仓库中。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容