这章看得我有点懵,对我来说没什么用,这章有点数据中台的味道,记得我上司说过数据中台不是设计出来的而是沉淀出来的
大部分环境中采用一个集中式数据仓库,但是在某些特定场合,可以建立分布式数据仓库,三种类型如下
- 拥有局部业务和全局业务的全球性企业服务的数据仓库
- 数据分布在多个物理的存储空间上的技术分布式数据仓库
- 拥有组织或者管理上独立的企业中独立部门无关联的数据仓库
不同类型的分布式数据仓库都有各自需要考虑的元素
一个全局数据仓库最难的是在分支机构上所做的映射.映射必须解决转换,集成和不同的业务实践等问题.映射是迭代式完成的
分布式数据仓库环境的协调和管理远比单个数据仓库要复杂的多.把数据从局部环境送到全局环境会带来几个问题
- 采用什么样的网络技术
- 数据的传输合法吗
- 在全局站点上有足够大的处理窗口吗
- 必须做什么样的技术转换
问题
- 局部数据在细节级的处理
- 局部细节数据不同的数据结构,存储引擎,是否统一平台
- 数据的冗余性的解决
- 原则上,局部数据应局部使用,全局数据应全局使用
- 全局数据仓库的建设,局部数据仓库的开发人员应该参与