数据仓库模型

什么是数据模型

数据模型是抽象描述现实世界的一种工具和方法,是通过抽象的实体及实体之间联系的形式,来表示现实世界中事务的相互关系的一种映射。

数据仓库建模步骤
  1. 业务建模,划分业务,梳理业务,适用的建模方法:实体建模。demo:
    划分业务:按照业务部门划分
    划分业务主题:xx部门划分为:浏览器/金融/搜索等;

  2. 领域概念建模,将业务建模抽象成实体,适用的建模方法:实体建模,将数据抽象成:实体-事件-说明。demo:
    浏览器o2o打点,deviceid(实体1)-itemid(实体2)-expose(事件)-在20190910 13:44:59的推荐path场景下(说明)

  3. 逻辑建模,实例化(实体的属性及实体之间的联系等),适用的建模方法:范式建模。demo:
    内容池(item实体属性表),用户属性表,ods层o2o表

  4. 物理建模,就是落地。demo:
    选择数据平台,如hive
    创建生成表的脚本,定义字段,规范字段转化的代码等,如:thrift生成hive表
    针对数据集市即(浏览器)的需要,按照维度建模的方法,生成一些事实表(o2o)和一些维表(暂无)

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 数据仓库是面向主题的、集成的、时变的和非易失的有组织的数据集合,支持管理决策制定。不同于面向OLTP(On-Lin...
    VentLam阅读 4,548评论 6 36
  • 1.数仓概述 数据仓库的建设是一个过程,而不是一个项目。在这个过程中我们需要形成自己的规范,以方便管理和维护。在数...
    高广超阅读 2,871评论 0 13
  • 关于Data Vault数据模型 Data Vault是一种数据仓库建模方法,用来存储来自多个操作型系统的完整的历...
    NEO_X阅读 3,708评论 0 7
  • 在Data Vault模型基础上构建数据集市 数据仓库抽取数据的过程中,特别是第一次导入之后的每一次增量抽取往往会...
    NEO_X阅读 733评论 0 2
  • 楚乔传看到第十九集,大魏昏君拔剑刺死了忠肝义胆的宋将军。可惜,大魏就这样又少了一个忠臣。正义感爆棚,一怒之下关掉视...
    土豆猫的土豆阅读 249评论 0 0