数据库事务隔离级别简介

Proudly powered by QKQ

对于数据库的ACID,最近又复习了一下,整理如下。

Q: 什么是ACID?

A: 四个单词的首字母缩写,其分别为:

  • Atomicity(原子性)
  • Consistency(一致性)
  • Isolation(隔离性)
  • Durability(持久性)

那么缩写的这四个又是什么?来看看WIKI:

In computer science, ACID (Atomicity, Consistency, Isolation, Durability) is a set of properties of database transactions intended to guarantee validity even in the event of errors, power failures, etc.

翻译一下:
在计算机科学中,ACID是数据库事务(Database transactions)的一组属性,用来保证数据库在出错、断电等情况下的正确性(Validity)。
换句话说,数据库中的事务,如果满足了ACID,那么在出错和断电的情况下,也能保证其正确性。所谓正确,也就是在该类场景下,表现的行为符合预期。
那么,什么样的行为才是符合预期的行为?留待后面回答。

K: 事务的属性,正确性
Q: 什么样的行为才是预期的行为?

Q: 什么是事务?

A: 依然来看看wiki:

In the context of databases, a sequence of database operations that satisfies the ACID properties (and these can be perceived as a single logical operation on the data) is called a transaction.

翻译:
在数据库的上下文中,一系列满足ACID条件(并在逻辑上可以认为是对数据的一个操作)的操作,称为事务。
主谓拆分:

  • 事务,是一系列的操作
  • 这一系列的操作,满足ACID
  • 逻辑上,这一系列的操作可以看做是对数据的一个操作

举个例子:
转账:从李四的账户转200块到张三的的账户上。

  • 一系列的操作:
    • 从李四账户上减去200块
    • 在张三账户上加上200块
  • 这一系列的操作符合ACID
  • 逻辑上讲,转账可以看做对数据的一个操作

K: 系列操作,满足ACID,逻辑单个
R: 组合起来,形成事务,all的关系
Q: ACID分别是什么?什么情况才算满足了?

Q: Atomicity是什么?

A: 继续WIKI

An atomic transaction is an indivisible and irreducible series of database operations such that either all occur, or nothing occurs.

翻译:
一个原子事务是指一系列不可分割、不可消减的操作,它们要么全执行,要么全不执行。

首先Atomicity是事务的一个属性,所以解释的时候,必然会涉及到事务。解释具体这个属性的事务的预期行为
这里,有一个我认为十分好记的关键字:All or Nothing,我翻译为所有或无。
K: 事务的属性,All or Nothing

Q: Consistency是什么?

A: WIKI

Consistency in database systems refers to the requirement that any given database transaction must change affected data only in allowed ways.

翻译:
数据库中的一致性,要求数据库事务对数据的影响必须是被允许的。

被谁允许的呢?
数据库本身。数据库具有一些constraints(限制),满足这些限制条件的,即是被允许的,否则就是不被允许的。即不允许,也就是不满足数据库的限制条件。

什么是数据库的限制(Database Constraints)?

A constraint is a property assigned to a column or the set of columns in a table that prevents certain types of inconsistent data values from being placed in the column(s).
-- What is data integrity? Explain constraints

翻译:
一个限制,是应用于数据库表中的一个或者几个列的规则,这些规则防止(与其他列不一样的)不一致的数据被存放到列中。

主谓分析:

  • 限制是规则
  • 针对表中的列的规则
  • 防止不一致的数据出现

数据库的限制(Database Constraints)有哪些?

  • Entity Integrity,保证没有重复的列
  • Domain Integrity ,数据满足定义的格式、类型、范围等
  • Referential integrity ,存在引用的列不能被删除
  • User-Defined Integrity ,用户自定义的,不在上面三个里面的规则

举些例子:

  • Primary Key (主键)
  • Foreign Key (外键)
  • Not Null
  • Unique
  • ...

Consistency,一致性,我认为就是需要数据库里面的数据在时间上是一致的,比如1分钟前插入的数据和1分钟之后插入的数据都是满足同一套约束条件的。
所谓一致,即满足同一套规则。

举个违反consistency的例子来说:

A DB that reported employee Joe Shmoe's department as Sales but that didn't list Joe Shmoe among the employees in the Sales department would be inconsistent.
It's a logical property of the DB, independent of the actual data. [9]

一个数据库显示公司员工Joe的部门是销售部,但是实际上销售部的员工列表里面并没有Joe。这就违反了consistency。考虑到具体的数据库实现:公司部门表为Department,员工表为Employee。其体现就是员工表里面,显示joe的部门是sales,但是sales的member表却没有joe这个人。


Screen Shot 2019-05-26 at 10.45.46 AM.png

考虑另一种情况,Department的member表中有一个wang的employee_id,但是User表里面却没有Wang这个employee。此时就违反了Referential integrity。

所以,到这里,我们可以看到integrity和consistency的关系就是,consistency需要满足很多个integrity。

K: 一致,约束,同一套规则

Q: Isolation是什么?

A: WIKI

Isolation is typically defined at database level as a property that defines how/when the changes made by one operation become visible to other.

翻译:
隔离性,是指数据库里面的一个操作产生的影响如何/什么时候对另一个操作可见。
这里有些断章取义的意味,更合适的,我认为应该是:
隔离性,规定了什么时候,一个事务产生的影响如何对另一个事务可见。

Isolation牵涉到两个概念:

  • Concurrency Control。并发控制,往往通过加锁的方式对并发操作进行一定的控制
  • Isolation Levels。隔离级别,由高到低分为四种:
    • Serializable, 串行,即两个事务不能同时执行,只有一个执行完成之后,才执行另一个
    • Repeatable reads, 可重复读
    • Read committed, 提交读,简单来说,就是提交了的数据才能读到
    • Read uncommitted, 未提交读,即未提交的数据也能读到

committed的意思就是提交,一般表示一个事务的结束。

Read Uncommitted: 直接翻译一下就是读取了未提交的数据,即事务A在进行操作的时候,事务B对数据产生的改动会被A直接读取到。这样的影响在于:事务A读取到的事务B产生的改动是不安全的,因为该改动可能被事务B回滚。这种情况,称为“脏读”,即读取了脏数据(事务B产生的改动)。

Read Committed: 直译就是读取的是已提交的数据。显而易见,这可以避免上面提到的脏读。然而,这样也有问题。其场景为:事务A在一个事务中需要两次读取同一条数据,在读取的间隙,事务B对该数据进行了改动,然后提交了。此时会造成事务A
两次读取到的数据不一样,虽然按道理应该是一样的。这样的问题,称为“不可重复读”

Repeatable Reads: 直译为可重复读。即保证了同一事务中两次读取的数据是一致的。即在事务开始之后,其他事务对数据的改动对该事务不可见。这时候出现的问题是,如果事务A中两次进行了范围查询(比如select * from user where age > 10),在两次查询之间,事务B插入了一条满足查询的数据,那么事务A中两次范围查询的结果不一样。此时事务A感觉出现了幻觉,这种情况,我们称为幻读。

Serializable:事务串行执行,可以解决上面提到的“脏读”、“不可重复读”、“幻读”问题,然而代价是不支持并行,性能差。

鉴于比较繁琐,列个表:

事务级别 可能出现的问题 出现问题的场景 造成的影响
Read Uncommitted 脏读 事务A读取了事务B即将回滚的数据 读取了错误的数据
Read Committed 不可重复读 事务A进行了两次数据读取,读取间隙,该数据被事务B改动且提交了 两次读取内容不一样,可能造成操作出错
Repeatable Reads 幻读 事务A进行了两次范围读取,读取间隙,该范围被事务B插入了数据且提交了 两次读取内容不一样,可能造成操作出错
Serializable 串行执行 性能低

K: 多个事务,影响可见,隔离级别
R:
Q: 各个事务级别如何实现?

Q: 各个事务级别如何实现?

A: 大约有两种方式:

  • 多版本并发控制(MVCC,Multi-Version Concurrency Control)

先来看看锁的实现方式。这里我们使用Mysql的一些定义[6],锁可以分为两种:

  • 共享锁(shared(s) lock),多个事务可以共享
  • 排他锁(exclusive(x) lock),同一时间,只能一个事务可以持有

一般来说:

  • 读取数据的时候,需要获取共享锁,即s锁
  • 修改或者删除数据的时候,需要获取排他锁

此处考虑两种情况及其处理方式:

  • 假设事务T1持有对行r的一个s锁,此时另一个事务T2需要对r行进行操作:
    • 事务T2希望获取s锁,此时可以立即获取到s锁
    • 事务T2希望获取x锁,此时无法立即获取到(需要等待之前的s锁被释放。有没有可能多个事务一直对某行加s锁,而一个想获取到x锁的事务一直都无法得到x锁(starving problem)?此时可以考虑请求锁的顺序,比如将锁的请求放到一个队列里面,先进先出。)
  • 假设事务T1持有对行r的一个x锁,此时另一个事务T2需要对r行进行操作:
    • 事务T2希望获取s锁,无法立即获取,需要等待x锁释放
    • 事务T2希望获取x锁,无法立即获取,需要等待x锁释放

可能的实现方式(读写前获取锁,事务结束之后释放锁):

隔离级别 读写锁实现
Read Uncommitted 无需任何锁
Read Committed 写锁等待读锁全部被释放,表明所有读操作完成。
写锁排斥读锁,因此写入的时候没有任何读操作
Repeatable Read 同上,由于写入的同时保证了没有事务在进行读取,因此不会出现不可重复读
Serializable 全都用排他锁咯

MVCC可以归纳为snapshot(快照)的其中一种。
为什么要使用MVCC?

最早的数据库系统,只有读读之间可以并发,读写,写读,写写都要阻塞。引入多版本之后,只有写写之间相互阻塞,其他三种操作都可以并行,这样大幅度提高了InnoDB的并发度。
---------http://mysql.taobao.org/monthly/2017/12/01/

隔离级别 读写锁实现
Read Uncommitted 不支持
Read Committed 读取之前获取快照,写锁并不需要等待读锁,读锁也不需要等待写锁的释放
事务读取的是快照,因此不会读取到事务未提交的数据
Repeatable Read 事务一开始的时候就获取快照
Serializable 不支持

Q: Durability是什么?

A: WIKI

In database systems, durability is the ACID property which guarantees that transactions that have committed will survive permanently.

翻译:
数据库中,持久性,表示事务提交之后,其产生的改变将会永久(permanently)存在。

就是说,事务提交了,那么这个事务的操作,对数据也就生效了。就算之后数据库挂了,机器断电了,这个改动依然存在,重启之后依然存在。
顺便提一句,对断电之后的处理,有一种方式是:事务提交之前,先把改动记录到log里面,然后每次启动的时候从log里面恢复数据。
K: 事务提交之后,依然存在
R: 发生的时间,结果

参考资料:
[1], https://en.wikipedia.org/wiki/Isolation_%28database_systems%29
[2], https://docs.microsoft.com/en-us/sql/connect/jdbc/understanding-isolation-levels?view=sql-server-2017
[3],[https://www.ibm.com/support/knowledgecenter/en/SSEPGG_10.5.0/com.ibm.db2.luw.admin.perf.doc/doc/c0004121.html(https://www.ibm.com/support/knowledgecenter/en/SSEPGG_10.5.0/com.ibm.db2.luw.admin.perf.doc/doc/c0004121.html)
[4], http://highscalability.com/blog/2011/2/10/database-isolation-levels-and-their-effects-on-performance-a.html
[5], https://www.allinterview.com/showanswers/5542/what-is-data-integrity-explain-constraints.html
[6], https://dev.mysql.com/doc/refman/8.0/en/innodb-locking.html
[7], 高性能Mysql
[8], http://ithare.com/databases-101-acid-mvcc-vs-locks-transaction-isolation-levels-and-concurrency/

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,142评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,298评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 162,068评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,081评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,099评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,071评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,990评论 3 417
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,832评论 0 273
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,274评论 1 310
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,488评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,649评论 1 347
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,378评论 5 343
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,979评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,625评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,796评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,643评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,545评论 2 352

推荐阅读更多精彩内容

  • 关于Mongodb的全面总结 MongoDB的内部构造《MongoDB The Definitive Guide》...
    中v中阅读 31,928评论 2 89
  • 一、事务 1、事务四要素:ACID 对于事务,我之前的理解是很粗糙的,不就是为了保证操作的原子性么?一般订单系统或...
    张伟科阅读 1,304评论 0 5
  • 中午老公火急火燎的赶时间,做了几个菜,我一看,一盘青菜,一盘肉丁青菜梗,这没点硬菜,还能吃饭吗?亏我昨晚还流着...
    思我君阅读 325评论 0 0
  • 随着大巴距临沂越来越近,我感觉到亲切,因为临沂是我的籍贯,是我的根。但又杂着陌生感,我出生和成长都不在临沂,只...
    星光一点阅读 107评论 0 2
  • 本篇结构: 前言 bat文件 startup.bat catalina.bat 总结 一、前言 一般启动tomca...
    w1992wishes阅读 1,315评论 1 5