数仓概要

一、概要

大数据平台由底层至上可分为:原始数据层、数据仓库、数据应用层。

图来自《数据产品经理修炼手册》梁旭鹏


二、原始数据层——ODS(Operational Data Store)层:

从数据来源来说

ODS层主要从 a.客户端用户操作日志(埋点,如PV、点击某按钮的次数)数据、

                        b.业务数据库(后端数据,如成交量、销售额)   获得数据。

从存储量来说

ODS层一般a.存储当前需要加载的数据,

                  b.存储处理完的历史数据,一般一定周期后(如3-6个月,具体看业务需要)清除,以此节省空间。

特点:

ODS数据结构、逻辑与数据来源保持一致,按分钟跟随业务系统数据变化,按天归档后汇入DW。

此层目的

a.一个是对散落多处的业务系统数据进行汇总,便于后续数据的抽取

b.转移一部分查询生成报表的压力,缓解业务系统的压力。

c.便于细节数据问题的定位查询。DW层是汇总后的数据,ODS层与原业务系统结构一致,可在此层进行定位。

三、数据仓库——DW (Data Warehouse)层:

通过ETL抽取(extract)转换(transform)加载(load))对ODS层数据进行逻辑加工处理而得到。为了满足企业做各种决策的集成数据环境,既不产生数据,也不消费数据。

ETL(Extract-Transform-Load),将数据从来源端经过 抽取、转换、加载 至目的端的过程。

a.抽取(extract):数据从数据源读出来

b.转换(transform):把原始数据转换成期望的格式、维度,包含数据清洗,去除噪音过程。(  比如:空值处理 / 规范化数据格式 / 拆分数据 / 验证数据合法性 / 数据替换 / 实现数据规则过滤 / 数据排序 / 数据类型统一转换 )

c.加载(load):把处理后的数据加载到目标处,比如数据仓库

数仓演变图-图来自阿里云云栖社区-付空

当前数据仓库按时效性需求分类,可分为两类:

a.实时数仓:实时产生结果

b.离线数仓:处理和保存大量异构复杂历史全量数据(如T+1的文本、图像、视频、音频);

实时数仓以Kappa架构为主,而离线数仓以传统大数据架构为主。Lambda架构是两者的中间态。

.下图为离线大数据架构示例:

离线数仓架构示例-图来自阿里云云栖社区-付空

此时数仓按汇总处理程度,又可细分为:

a.基础层(DWD明细表)、b.数据集市(DM(Data Mart)面向应用,依据业务需要做不同维度的聚合汇总,如电商的商品主题、订单主题、佣金主题、维度表、事实表,一般是T+1)。

.下图为实时Kappa架构示例:


实时Kappa架构示例 -图来自阿里云云栖社区-付空  

四、数据应用层 —— 消费数据仓库的数据:

应用可分为三类:

1)描述事实类分析应用

主要是对当前事实数据进行可视化展现。比如通过EXCEL\BI工具对常规业务报表,明细数据表等进行可视化展现。

2)预测性分析应用

根据过去的事实数据,通过成熟算法模型对未来业务趋势效果进行计算、预测。

3)指导意见

基于业务经验和过去事实、未来预测输出全面分析专题报告,为商业决策提供指导意见。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351