谁需要数据仓库?
所有类型的用户都需要 DWH(数据仓库),例如:
- 依赖海量数据的决策者
- 使用定制的复杂流程从多个数据源获取信息的用户。
- 需要简单技术来访问数据的人也使用它
- 对于那些希望采用系统方法进行决策的人来说,这也是必不可少的。
- 如果用户希望在报表、网格或图表所必需的大量数据上获得快速性能,那么数据仓库证明是有用的。
- 如果您想发现数据流和分组的“隐藏模式”,则数据仓库是第一步。
数据仓库有什么用?
以下是使用数据仓库的最常见部门:
航空公司:
在航空公司系统中,用于机组分配、航线盈利分析、常旅客计划促销等运营目的。
银行业:
它被广泛用于银行业,以有效管理桌面上的可用资源。很少有银行还用于市场研究、产品和运营的绩效分析。
卫生保健:
医疗保健部门还使用数据仓库来制定战略和预测结果,生成患者的治疗报告,与配套保险公司、医疗援助服务等共享数据。
公共部门:
在公共部门,数据仓库用于情报收集。它帮助政府机构维护和分析每个人的税务记录、健康政策记录。
投资及保险业:
在该领域,仓库主要用于分析数据模式、客户趋势和跟踪市场动向。
零售连锁:
在零售连锁店中,数据仓库广泛用于分销和营销。它还有助于跟踪项目、客户购买模式、促销活动,还用于确定定价政策。
电信:
该部门使用数据仓库进行产品促销、销售决策和分销决策。
酒店业:
该行业利用仓库服务根据客户的反馈和旅行模式来设计和估算他们想要针对客户的广告和促销活动。
实施数据仓库的步骤
解决与数据仓库实施相关的业务风险的最佳方法是采用如下三管齐下的策略
- 企业战略:在这里我们确定技术,包括当前的架构和工具。我们还确定事实、维度和属性。数据映射和转换也通过。
- 分阶段交付:数据仓库实施应根据主题领域分阶段实施。预订和计费等相关业务实体应首先实施,然后相互集成。
- 迭代原型:数据仓库应该迭代地开发和测试,而不是大爆炸的实现方法。
以下是 Datawarehouse 实施及其可交付成果的关键步骤。
步 | 任务 | 可交付成果 |
---|---|---|
1 | 需要定义项目范围 | 范围定义 |
2 | 需要确定业务需求 | 逻辑数据模型 |
3 | 定义操作数据存储要求 | 操作数据存储模型 |
4 | 获取或开发提取工具 | 提取工具和软件 |
5 | 定义数据仓库数据要求 | 转换数据模型 |
6 | 记录缺失数据 | 待办事项清单 |
7 | 将操作数据存储映射到数据仓库 | D/W 数据集成图 |
8 | 开发数据仓库数据库设计 | D/W 数据库设计 |
9 | 从操作数据存储中提取数据 | 集成 D/W 数据提取 |
10 | 加载数据仓库 | 初始数据加载 |
11 | 维护数据仓库 | 正在进行的数据访问和后续加载 |
实施数据仓库的最佳实践
- 决定测试数据的一致性、准确性和完整性的计划。
- 数据仓库必须集成良好、定义明确并带有时间戳。
- 在设计 Datawarehouse 时,请确保使用正确的工具,坚持生命周期,注意数据冲突,并准备好了解自己的错误。
- 永远不要更换操作系统和报告
- 不要在提取、清理和加载数据上花费太多时间。
- 确保让包括业务人员在内的所有利益相关者都参与到数据仓库实施过程中。确定数据仓库是一个联合/团队项目。您不想创建对最终用户无用的数据仓库。
- 为最终用户制定培训计划。
重点学习
- 数据仓库用于不同的行业,如航空、银行、医疗保健、保险、零售等。
- 实施 Datawarehosue 是一个三管齐下的策略,即。企业战略、分阶段交付和迭代原型。
- 数据仓库允许业务用户在一处快速访问来自某些来源的关键数据。