数仓开发
- 确定主题
- 选择平台软件,譬如hdfs/hbase/hive,以满足不同需求
- 梳理数据仓库的逻辑模型,譬如,主题之间的关系,把数据梳理归类到对应的业务模型-》概念模型-》逻辑模型
- 将逻辑模型转化为数据仓库中的物理模型
- 优化数据仓库,主要合理合并不同的数据表,避免过多的动态汇总。
- etl
- 开发bi
- 数仓管理,包括数据库管理及元数据管理。安全性,高可用,备份,数据过期
元数据
元数据是什么?
- 源数据的定义,结构,位置,类型
- 数据转化规则
- 源数据到目标数据仓库的映射关系
- 目标数据仓库模型???
- 报表描述
- bi、函数描述