数仓(DW)分层

为什么要分层

  • 复杂问题简单化:将一个复杂的任务分解成多个步骤来完成,每一层只处理单一的步骤,比较简单,且方便定位问题..
  • 减少重复开发:规范数据分层,通过中间层的数据,能够减少重复的计算,增加一次计算结果的复用性,即节省了大量的计算时间.
  • 隔离原始数据:数据的敏感,将原始数据层和统计数据进行了解耦,比如原始数据有一些数据比如身份证信息不方便访问的话,可以打上***标识,类似于脱敏处理,另外还可以通过增加用户权限,原始数据层只允许个别用户访问,这样也可以起到了保护数据信息的作用.因为原始数据比如身份证信息等都能够拿到.

常见的分层

数仓中分层一般常见的都是4层或者5层
4层分为ODS层,DWD层,DWS层,APP/ADS层
5层分为ODS层,DWD层,DWS层,DWT层,APP/ADS层

4层和5层分层:

##############4层4层4层#######################
保险行业

ODS(Operation Data Store)层: 原始数据层(和业务表结构一致),存放原始数据,直接加在原始数据日志,数据,保持数据样貌不过改变.

DWD(Data warehouse detail)层: 明细层(业务表结构一致),对ODS层数据进行数据清洗(脏数据,空值处理(比如原本是空的,放一个默认值)等)
则根据【主题】定义好【事实表】和【维度表】,保存最细粒度的数据,
可以等价于业务数据库的表,因为他会把每天的增量汇总到一起,他把ODS的数据汇集到一起的
<DWD层是真正发力的层,DWD层数据就全了.>

DWS(Data Warehouse Service层: 轻度汇总层,以DWD层为基础进行轻度汇总,做成宽表。

ADS层/APP层(Application Data Store): 数据应用层,为各种统计报表提供数据

##############5层5层5层#######################
电商行业

ODS(Operation Data Store)层:原始数据层(和业务表结构一致),存放原始数据,直接加在原始数据日志,数据,保持数据样貌不过改变.

DWD(Data Warehouse Detail):明细数据层,对ODS层数据进行清洗,去除空值,脏数据,超出极限范围的数据,脱敏等,保存明细数据,一行信息代表依次业务行为,比如一次下单

DWS(Data Warehouse Service):服务数据层,按天进行轻度汇总,一行数据代表一个主题对象一天的汇总行为,例如一个用户一天下单次数.
主题:比如用户主题,商品主题,订单主题
主题对象:不同主题有不同的主题对象,以用户主题为例,一个主题对象就是一个用户

DWT(Data Warehouse Topic):数据主题层,以DWS为基础,对数据进行累积汇总,一行信息代表一个主题对象的累积行为,例如一个用户从注册那天到现在总的下单次数

ADS(Application Data Store):数据应用层,为各种统计报表提供数据

其实具体的分层数量以及命名规则,完全是需要根据公司业务复杂程度来定,并不是层数越多越好,层数越多,伴随着数据冗余越大,层数越少,伴随着大量的重复计算,所以分层数量一般根据业务复杂度来看

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,542评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,596评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,021评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,682评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,792评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,985评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,107评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,845评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,299评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,612评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,747评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,441评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,072评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,828评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,069评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,545评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,658评论 2 350

推荐阅读更多精彩内容