数仓开发流程

数仓开发

  1. 确定主题
  2. 选择平台软件,譬如hdfs/hbase/hive,以满足不同需求
  3. 梳理数据仓库的逻辑模型,譬如,主题之间的关系,把数据梳理归类到对应的业务模型-》概念模型-》逻辑模型
  4. 将逻辑模型转化为数据仓库中的物理模型
  5. 优化数据仓库,主要合理合并不同的数据表,避免过多的动态汇总。
  6. etl
  7. 开发bi
  8. 数仓管理,包括数据库管理及元数据管理。安全性,高可用,备份,数据过期
元数据
元数据是什么?
  1. 源数据的定义,结构,位置,类型
  2. 数据转化规则
  3. 源数据到目标数据仓库的映射关系
  4. 目标数据仓库模型???
  5. 报表描述
  6. bi、函数描述
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容