数据库总结（三）

image.png

系统

如下图所示，数据库管理系统作为中间节点，外接应用程序，内接物理硬件，其系统运作的主要目的是为了满足，因此需要有效的防范机制保证其内部运行。

image.png

（一）查询及优化

用户对数据库最频繁的操作为使用DML语言进行的各类操作，因此有必要对数据库的查询做出优化。

image.png

1.查询

查询分为四个流程：查询分析->查询检查->查询优化->查询执行。这四个流程是一条流水线。

场景：用户写了一条SQL语句对某关系表进行查询。SQL语句经过语言处理层时，进行查询分析，对SQL语法进行检查，接着进入数据存取层，进行查询检查，主要对SQL语句中的关系名、属性名是否存在和有效进行校验，同时进行完整性检查。检查无误后由查询优化器对SQL语句进行查询优化，最后执行优化后的代码并将结果返回。

2.优化

优化从两个维度着手，代数优化和物理优化。在我看来，代数优化由用户掌控，物理优化则通过优化存取路径及方法来实现。

2.1代数优化

代数关系与SQL语句对同一操作的描述有着对应关系，通过了解代数优化从而学习SQL优化。

做数学运算时我们常通过改变运算顺序更快捷求出结果。使用代数关系优化与数学运算的思想一致。
常用的代数关系优化规则有：
（1）选择运算尽可能先做；
（2）把投影运算和选择运算同时进行；
（3）把投影同其前或后的双目运算结合起来；
（4）把某些选择同在它前面要执行的笛卡尔积结合起来成为一个连接运算；
（5）找出公共子表达式；

选择、投影运算类似加减，计算方便；笛卡尔积相当于乘法，运算量大，公共子表达式类似合并同类项

2.2物理优化

数据均存在磁盘上，因此物理优化是对数据组织及联系进行优化。

2.2.1 对存取方法选择

存取方法的选择有两种：索引方法和聚簇方法。

2.2.1.1 索引方法

通常在关系中某一组属性或某个属性上建立索引（类似新华字典中大写字母ABC）。

2.2.1.1.1 B+树索引存取方法

以属性为单位，且以查询操作为主则考虑建立B+树索引，如果更新操作频繁则放弃。
（1）对某一个（组）属性的查询操作频繁；
（2）对某一个属性进行聚集函数类的操作；
（3）对某一个（组）属性在连接操作的连接条件中出现；

2.2.1.1.2 hash索引存取方法

（1）一个关系大小可预知，且不变；
（2）关系的大小动态改变，但数据库管理系统提供了动态hash存取方法。

2.2.1.2 聚簇方法

使用聚簇方法主要关注DML中对属性上的值操作是否频繁。
（1）对经常在一起进行连接操作的关系可以建立聚簇；
（2）一个关系的一组属性经常出现在相等比较条件中，这单个关系可以建立聚簇；
（3）一个关系的一个（组）属性上的值重复率很高，对这单个关系可以建立聚簇。

（二）恢复技术

恢复技术和并行控制的理论依据都基于事务。

恢复技术

1.事务

事务：用户定义的一个数据库操作序列，这些操作要么全做，要么全部做，是一个不可分割的工作单位（类似指令）

特点：原子性、一致性、隔离性和持续性。
原子性：事务中包括的诸操作要么都做，要么都不做（对应事务定义）；
一致性：事务执行的结果必须是使数据从一个一致性状态变到另一个一致性状态（数据的正确性特点）；
隔离性：一个事务的执行不能被其他事务干扰；
持续性：一个事务一旦提交，它对数据库中数据的改变就应该是持久性。

2.恢复技术

故障种类不同，采取的恢复策略也就不一样。

2.1分类

2.1.1事务内部故障（程序级）

事务内部故障可以分为可预期和非可预期。如运算溢出、并发事务发生死锁而被选中撤销该事务、违反了某些完整性限制而被终止。可预期故障由程序控制来避免，而非可预期故障则需要进行事务撤销。
各个事务的开始由 BEGIN TRANSACTION 标记，结束由 COMMIT 或 ROLLBACK 标记。若没有结束标记则表示事务发生非可预期故障。

2.1.2系统故障（软故障，系统级）

常指由于系统停止运转的任何事件，使得系统要重启。比如CPU错误、操作系统故障、DBMS代码错误和系统断电等。

2.1.3介质故障（硬故障，设备级）

通常指外存故障，如磁盘损坏等。

区别系统故障与介质故障主要从该故障由软、或是硬引起。

2.1.4计算机病毒（外界因素）

2.2技术实现

恢复技术通过冗余来实现，即数据（数据转储）和操作（日志文件）。

image.png

2.3策略

根据故障种类的分类恢复策略主要分为三种：事务故障恢复、系统故障恢复、介质故障恢复。除这三种策略外，还有检查点恢复技术。

2.3.1事务故障恢复

事务故障恢复的思路主要是反向扫描日志文件，通过扫描日志文件找出事务断点，并恢复到事务开始前的状态。

如下图，事务T1在t1时刻开始，t2时遇到故障，此时未完成所有操作，系统将反向扫描日志文件，将数据恢复到T1时刻前。

事务故障恢复

2.3.2系统故障恢复

正向扫描日志文件（找出已提交事务）+反向扫描文件（未提交事务）
对已提交事务进行重做；
对未提交事务进行撤销。

2.3.3介质故障恢复

重装数据库+重做已完成事务

2.3.4具有检查点的恢复技术

检查点技术用于解决搜索日志及重做事务花费时间大的问题，也就是省去从头开始的重复工作。数据转储记录的是数据，日志文件记录的是操作，检查点记录：

检查点时刻所有正在执行的事务 ；
这些事务的最近一个日志记录（日志文件）的地址
利用检查点记录，不需要从头扫描日志文件，只需要从检查点时刻开始扫描日志。

image.png

（三）并行控制

由于多个事务并行操作数据，会导致数据不一致性，为了保证事务的隔离性和一致性，对并行操作进行控制。

并行控制

3.1出现数据不一致性的类型

3.1.1丢失修改（写-写错误）

两个事务同时对某一数据进行修改。

3.1.2不可重复读（读-写错误）

事务1读取数据，事务2对该数据进行修改，使事务1无法再读取前一次的结果。

3.1.3读“脏”数据（写-读错误）

事务1修改数据后写回，事务2读取该数据，事务1撤销操作，事务2读取的数据与之前不一致。

3.2解决办法—封锁

封锁策略是对操作数据的保护，但是对数据的操作程度不同，分为排他锁和写锁，这两种锁通常组合使用。

image.png

3.3封锁引起的问题—活锁和死锁

封锁的使用降低资源的流动性，引发活锁和死锁。

活锁造成某一事务长期等待，出现饥饿现象，解决办法采用先来先服务。
死锁则是多个事务之间长期等待，解决办法可以采用超时法和等待图法。

最后编辑于：2020.03.23 11:24:29

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 219,539评论 6赞 508
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 93,594评论 3赞 396
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 165,871评论 0赞 356
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 58,963评论 1赞 295
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 67,984评论 6赞 393
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 51,763评论 1赞 307
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 40,468评论 3赞 420
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 39,357评论 0赞 276
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 45,850评论 1赞 317
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 38,002评论 3赞 338
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 40,144评论 1赞 351
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 35,823评论 5赞 346
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 41,483评论 3赞 331
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 32,026评论 0赞 22
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 33,150评论 1赞 272
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 48,415评论 3赞 373
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 45,092评论 2赞 355

数据库总结（三）

系统

（一）查询及优化

1.查询

2.优化

2.1代数优化

2.2物理优化

2.2.1 对存取方法选择

2.2.1.1 索引方法

2.2.1.1.1 B+树索引存取方法

2.2.1.1.2 hash索引存取方法

2.2.1.2 聚簇方法

（二）恢复技术

1.事务

2.恢复技术

2.1分类

2.1.1事务内部故障（程序级）

2.1.2系统故障（软故障，系统级）

2.1.3介质故障（硬故障，设备级）

2.1.4计算机病毒（外界因素）

2.2技术实现

2.3策略

2.3.1事务故障恢复

2.3.2系统故障恢复

2.3.3介质故障恢复

2.3.4具有检查点的恢复技术

（三）并行控制

3.1出现数据不一致性的类型

3.1.1丢失修改（写-写错误）

3.1.2不可重复读（读-写错误）

3.1.3读“脏”数据（写-读错误）

3.2解决办法—封锁

3.3封锁引起的问题—活锁和死锁

推荐阅读更多精彩内容