第一章:数据仓库和商业智能及维度建模初步

20190805

第一章

一、DW/BI系统,即数据仓库和商业智能(Data Warehousing and Business Intelligence)系统,主要用于数据的使用,也就是分析。

二、信息用作的两个目的:操作型记录的保存和分析型决策的制定。

三、该系统要实现的目标:

1.让业务用户能够简单、快捷的以各种形式分割和合并分析数据。

2.必须展现一致的信息,也就是要有统一的标准,数据质量要保证,数据定义要统一。

3.最好做到兼容性比较强大,在用户需求、业务环境、数据及技术产生变化时,能够兼容或者在必须做出改变时也能保证之前的数据和应用不被修改。

4.必须要能够及时展现信息,保证数据安全

5.要能成为提高决策制定能力的权威和可信的基础,也就是要准确权威,有价值。该系统早期被称为决策支持系统。

6.让业务群体能够接受并积极使用该系统。

四、需要用到的技能包括数据库管理的技能和商业分析师的技能

五、创建该系统三大步骤:理解业务用户;对业务用户发布高质量、相关的、可访问的信息和分析;维护DW/BI环境


六、维度建模简介

1.维度建模是战线分析数据的首选技术:

   原因如下:* 以商业用户可理解的方式发布数据

                     *提供高效的查询性能

2.从简单的数据模型开始是保持设计简单性的基础。如果从复杂的数据模型起步,那么最终会导致模型过度复杂,从而导致查询性能低下,最终是商业用户反感。

3.第三范式(3NF):即第三范式是要求一个数据库表中不包含已在其他表中包含的非主关键字信息。数据库中强调的3NF主要是为了消除冗余。

         规范化的3NF将数据划分为多个不同的实体,每个实体构成一个关系表。尽管维度模型通常应用在关系数据库管理系统之上,但是并不要求维度模型必须满足第三范式3NF。

4.维度模型与规范化模型(如3NF模型)的区别:

       维度模型包含的信息和规范化模型包含的信息相同,但对数据以一种用户可理解的、满足查询性能要求的、灵活多变的方式进行了包装。

5.星型模式与OLAP多维数据库

(1).星型模式:在关系数据库管理系统中实现的维度模型称为星型模式

(2).OLAP多维数据库:在多维数据库环境中实现的维度模型通常称为联机分析处理(OnLine Analytical Processing,OLAP)多维数据库。

OLTP:业务类系统主要供基层人员使用,进行一线业务操作,通常被称为OLTP(OnLine Transaction Processing)联机事务处理

(3).OLAP:数据分析的目标是探索并挖掘数据价值,作为企业高管进行决策的参考。

基本分析操作有:钻取、切片、切块、旋转等。

OLAP软件通常使用于:销售与市场业务报表,管理报表,趋势分析等类似的领域中。

6.用于度量的事实表

(1).维度模型中的事实表存储组织机构业务过程事件的性能度量结果。

应该尽量将来源于同一个业务过程的底层度量结果存储于一个维度模型中;应该允许多个组织的业务用户访问同一个单一的集中式数据仓库,确保整个企业使用一致的数据。

(2).事实表中的每行对应一个度量事件。每行中的数据是一个特定级别的细节数据,称为粒度。

(3).维度建模的核心原则之一是同一事实表中的所有度量行必须具有相同的粒度;

基本原则是:物理世界的每一个度量事件与对应的事实表行具有一对一的关系。

7.用于描述环境的维度表:

        数据仓库的好坏直接取决于维度属性的设置;DW/BI环境的分析能力直接取决于维度属性的质量和深度。

        为维度属性提供详细的业务术语耗费的精力越多,效果就越好;为属性列填充领域值耗费的精力越多,效果就越好;为确保属性值的质量耗费时间越多,效果就越好。强大的维度属性带来的回报是健壮的分片-分块分析能力。

8.维度建模:

(1).维度模型中不仅包含汇总数据,汇总数据只是在针对公共查询时能够比粒度数据提供更好的性能,但它不能取代细节数据。维度模型中可用的历史数据的数量必须有业务需求驱动。

(2).维度模型应该围绕业务过程组织,例如订单、发货、服务调用等,避免多次获取同一个数据源的数据,免的产生多个不一致的分析数据库。

(3).维度模型非常易于扩展。不仅仅用于预测。维度模型可以被集成。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,634评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,951评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,427评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,770评论 1 290
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,835评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,799评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,768评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,544评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,979评论 1 308
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,271评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,427评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,121评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,756评论 3 324
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,375评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,579评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,410评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,315评论 2 352