DW2.0 下一代数据仓库的构架

第1章    数据仓库简史及第一代数据仓库

    1.1    数据库管理系统

    1.2    在线应用

    1.3    个人电脑和4GL技术

    1.4    蜘蛛网环境

    1.5    企业角度的演化

    1.6    数据仓库环境

    1.7    什么是数据仓库

    1.8    整合数据——一个痛苦的经历

    1.9    数据的量

    1.10    一种不同的开发方法

    1.11    演变到DW2.0环境

    1.12    数据仓库的商业影响

    1.13    数据仓库环境的各种组件

        1.13.1    ETL——抽取/转换/装载

        1.13.2    ODS——操作数据存储

        1.13.3    数据集市

        1.13.4    探索仓库

    1.14    数据仓库的演变——从企业的角度

    1.15    关于数据仓库的其他观念

    1.16    主动数据仓库

    1.17    联合数据仓库方法

    1.18    星状模式方法

    1.19    数据集市数据仓库

    1.20    建立一个“真正的”数据仓库

    总结

第2章    DW2.0 简介

    2.1    DW2.0——一种新的范式

    2.2    DW2.0——从企业的角度

    2.3    数据的生命周期

    2.4    设置不同区的原因

    2.5    元数据

    2.6    数据访问

    2.7    结构化数据/非结构化数据

    2.8    文本分析

    2.9    “废话”

    2.10    术语问题

    2.11    特定文本/一般文本

    2.12    元数据——一个主要组成部分

    2.13    本地元数据

    2.14    基础技术

    2.15    不断变化的业务需求

    2.16    DW2.0中的数据流

    2.17    数据量

    2.18    实用应用程序

    2.19    DW2.0和参照完整性

    2.20    DW2.0的报告

    总结

第3章    DW2.0组成部分——关于不同区

    3.1    交互区

    3.2    整合区

    3.3    近线区

    3.4    归档区

    3.5    非结构化处理

    3.6    企业用户的观点

    总结

第4章    DW2.0中的元数据

    4.1    数据和分析的可复用性

    4.2    DW2.0中的元数据

    4.3    主动知识库/被动知识库

    4.4    主动知识库

    4.5    企业元数据

    4.6    元数据和记录系统

    4.7    分类

    4.8    内部分类/外部分类

    4.9    归档区元数据

    4.10    维护元数据

    4.11    举例说明如何使用元数据

    4.12    终端用户的观点

    总结

第5章    DW2.0技术基础设施的流动性

    5.1    技术基础设施

    5.2    快速的业务改变

    5.3    环状改变

    5.4    打破循环

    5.5    缩短IT响应时间

    5.6    语义暂态,语义常态数据

    5.7    语义暂态数据

    5.8    语义稳定的数据

    5.9    混合语义稳定和不稳定的数据

    5.10    分离语义稳定和不稳定数据

    5.11    减缓业务的改变

    5.12    创建数据快照

    5.13    历史记录

    5.14    数据划分

    5.15    终端用户的观点

    总结

第6章    DW2.0的方法与途径

    6.1    螺旋式方法——主要特点综述

    6.2    七流法——总览

    6.3    企业参考模型流

    6.4    企业知识协调流

    6.5    信息工厂开发流

    6.6    数据归档定位流

    6.7    数据纠正流(旧称数据清理流)

    6.8    基础设施流

    6.9    整体信息质量管理流

    总结

第7章    统计处理和DW2.0

    7.1    两种类型的处理

    7.2    使用统计分析

    7.3    比较的完整性

    7.4    启发式分析

    7.5    冻结的数据

    7.6    探索型

    7.7    分析频率

    7.8    探索工具

    7.9    探索型处理数据的来源

    7.10    更新探索数据

    7.11    基于项目的数据

    7.12    数据集市和探索工具

    7.13    数据回流

    7.14    在内部使用探索数据

    7.15    企业分析员的观点

    总结

第8章    数据模型与DW2.0

    8.1    智能路线图

    8.2    数据模型和企业

    8.3    整合范围

    8.4    区别粒状型数据和概括型数据

    8.5    数据模型的层次

    8.6    数据模型和交互区

    8.7    企业数据模型

    8.8    模型转化

    8.9    数据模型和非结构化数据

    8.10    企业用户的观点

    总结

第9章    监视DW2.0环境

    9.1    监视DW2.0环境

    9.2    事务监视

    9.3    数据质量监视

    9.4    数据仓库监视

    9.5    事务监视——响应时间

    9.6    高峰期处理

    9.7    ETL数据质量监视

    9.8    数据仓库监视工具

    9.9    休眠数据

    9.10    企业用户的观点

    总结

第10章    DW2.0与安全

    10.1    保护访问数据

    10.2    加密技术

    10.3    缺点

    10.4    防火墙

    10.5    使数据脱机

    10.6    限制性加密

    10.7    直接转储

    10.8    数据仓库监视

    10.9    检测攻击

    10.10    近线区数据的安全

    10.11    企业用户的观点

    总结

第11章    时间相关数据

    11.1    DW2.0中的所有数据——与时间相关

    11.2    交互区中的时间相关性

    11.3    DW2.3其他部分中的数据相关

    11.4    整合区中的事务处理

    11.5    离散数据

    11.6    连续时间段数据

    11.7    一个记录序列

    11.8    非重叠记录集

    11.9    开始和结束一个记录序列

    11.10    数据的连续性

    11.11    时间瓦解数据

    11.12    归档区中的时间相关变量

    11.13    企业用户的观点

    总结

第12章    DW2.0的数据流

    12.1    贯穿整个架构的数据流

    12.2    进入交互区

    12.3    ETL的角色

    12.4    进入整合区的数据流

    12.5    进入近线区的数据流

    12.6    进入归档区的数据流

    12.7    下降的数据访问概率

    12.8    数据的异常流

    12.9    企业用户的观点

    总结

第13章    ETL处理与DW2.0

    13.1    转换数据状态

    13.2    ETL适用范围

    13.3    应用数据到企业数据的转换

    13.4    ETL工作模式

    13.5    源和目标

    13.6    ETL映射

    13.7    状态转换——实例

    13.8    更加复杂的转换

    13.9    ETL与吞吐量

    13.10    ETL与元数据

    13.11    ETL与审核记录

    13.12    ETL与数据质量

    13.13    创建ETL

    13.14    代码创建或参数驱动的ETL

    13.15    ETL与丢弃

    13.16    变化数据的捕获

    13.17    ETL

    13.18    企业用户的观点

    总结

第14章    DW2.0与粒度管理器

    14.1    粒度管理器

    14.2    提高粒度级别

    14.3    过滤数据

    14.4    粒度管理器的功能

    14.5    本地与第三方粒度管理器的比较

    14.6    粒度管理器的并行化

    14.7    作为副产品的元数据

    14.8    企业用户眼中的粒度管理器

    总结

第15章    DW2.0和性能

    15.1    好的性能——DW2.0的基石

    15.2    在线响应时间

    15.3    分析响应时间

    15.4    数据的流动

    15.5    队列

    15.6    启发式处理

    15.7    分析的生产率和响应时间

    15.8    索引

    15.9    移除休眠数据

    15.10    终端用户培训

    15.11    监控环境

    15.12    容量规划

    15.13    元数据

    15.14    批处理的并行

    15.15    事务处理的并行

    15.16    工作负荷量的管理

    15.17    数据集市

    15.18    探索工具

    15.19    将事务分为不同的类

    15.20    服务标准协议

    15.21    保护交互区

    15.22    数据分割

    15.23    选择合适的硬件

    15.24    区分“农民”和“探索者”

    15.25    数据的物理分组

    15.26    检查自动产生的代码

    15.27    企业用户的观点

    总结

第16章    迁移

    16.1    房屋和城市

    16.2    在一个完美情况中迁移

    16.3    完美情况几乎永远不会发生

    16.4    增量式添加组件

    16.5    添加归档区

    16.6    建立企业元数据

    16.7    建立元数据基础结构

    16.8    “吞没”源系统

    16.9    作为缓冲区的ETL

    16.10    迁移到非结构化的环境

    16.11    企业用户的观点

    总结

第17章    成本验证和DW2.0

    17.1    DW2.0的成本值吗

    17.2    宏观层次的价值验证

    17.3    微观层次的价值验证

    17.4    公司B拥有DW2.0

    17.5    生成新的分析

    17.6    按步骤执行

    17.7    总成本是多少

    17.8    考虑公司B

    17.9    考虑DW2.0的成本

    17.10    信息的现实情况

    17.11    DW2.0真正的经济效益

    17.12    信息的时间价值

    17.13    整合的价值

    17.14    历史信息

    17.15    第一代DW和DW2.0——在经济效益上的比较

    17.16    企业用户的观点

    总结

第18章    DW2.0中的数据质量

    18.1    DW2.0中的数据质量工具集

    18.2    数据分析工具和逆向工程数据模型

    18.3    数据模型种类

    18.4    数据分析不一致对自上而下建模的挑战

    总结

第19章    DW2.0和非结构化数据

    19.1    DW2.0和非结构化数据

    19.2    文本读取

    19.3    在哪里进行文本分析处理

    19.4    文本整合

    19.5    简单编辑

    19.6    无用词

    19.7    同义词替换

    19.8    同义词串联

    19.9    同形异义解析

    19.10    建立主题

    19.11    外部术语表/分类法

    19.12    分词

    19.13    替换拼写

    19.14    跨语言的文本

    19.15    直接搜索

    19.16    间接搜索

    19.17    术语

    19.18    半结构化数据/值=名称数据

    19.19    准备数据所需的技术

    19.20    关系数据库

    19.21    结构化/非结构化连接

    19.22    企业用户的观点

    总结

第20章    DW2.0与记录系统

    20.1    其他记录系统

    20.2    企业用户的观点

    总结

第21章    多方面的话题

    21.1    数据集市

    21.2    数据集市带来的便利

    21.3    转换数据集市数据

    21.4    监视DW2.0

    21.5    在数据集市间移动数据

    21.6    不合格数据

    21.7    用以平衡的条目

    21.8    重新设置值

    21.9    数据修正

    21.10    数据移动的速度

    21.11    数据仓库工具

    总结

第22章    DW2.0环境中的处理

    总结

第23章    管理DW2.0环境

    23.1    数据模型

    23.2    构架管理

        23.2.1    确定什么时候需要归档区

        23.2.2    确定是否需要近线区

    23.3    元数据管理

    23.4    数据库管理

    23.5    数据管理

    23.6    系统和技术管理

    23.7    DW2.0环境管理人员的管理

        23.7.1    优化及优先冲突

        23.7.2    预算

        23.7.3    进度表和里程碑的确定

        23.7.4    资源分配

        23.7.5    管理咨询人员

    总结

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 218,386评论 6 506
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,142评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,704评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,702评论 1 294
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,716评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,573评论 1 305
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,314评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,230评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,680评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,873评论 3 336
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,991评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,706评论 5 346
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,329评论 3 330
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,910评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,038评论 1 270
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,158评论 3 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,941评论 2 355

推荐阅读更多精彩内容