数据库事务(mysql数据库为例)

Mysql事务.png

概念

数据库事务( transaction)是访问并可能操作各种[数据项]的一个数据库操作[序列],这些操作要么全部执行,要么全部不执行,是一个不可分割的工作单位。事务由事务开始与事务结束之间执行的全部数据库操作组成。

性质(ACID)

  1. 原子性(Atomicity)
    事务中的全部操作在数据库中是不可分割的,要么全部完成,要么全部不执行。
  2. 一致性(Consistency)
    几个并行执行的事务,其执行结果必须与按某一顺序 串行执行的结果相一致。
  3. 隔离性(Isolation)
    事务的执行不受其他事务的干扰,事务执行的中间结果对其他事务必须是透明的。
  4. 持久性(Durability)
    对于任意已提交事务,系统必须保证该事务对数据库的改变不被丢失,即使数据库出现故障。

事务的ACID特性是由关系数据库系统来实现的,DBMS采用日志来保证事务的原子性、一致性和持久性。日志记录了事务对数据库所作的更新,如果某个事务在执行过程中发生错误,就可以根据日志撤销事务对数据库已做的更新,使得数据库回滚到执行事务前的初始状态。

对于事务的隔离性,DBMS是采用锁机制来实现的。当多个事务同时更新数据库中相同的数据时,只允许持有锁的事务能更新该数据,其他事务必须等待,直到前一个事务释放了锁,其他事务才有机会更新该数据。

事务想要做到什么效果?

  • 可靠性
    数据库要保证当insert或update操作时抛异常或者数据库crash的时候需要保障数据的操作前后的一致,想要做到这个,我需要知道我修改之前和修改之后的状态,所以就有了undo log和redo log。
  • 并发处理
    也就是说当多个并发请求过来,并且其中有一个请求是对数据修改操作的时候会有影响,为了避免读到脏数据,所以需要对事务之间的读写进行隔离,至于隔离到啥程度得看业务系统的场景了,实现这个就得用MySQL 的隔离级别。

一、redo log 与 undo log

1. redo log

  • redo log是什么?
    叫做重做日志,是用来实现事务的持久性。
    该日志文件由两部分组成。
    1. 重做日志缓冲(redo log buffer),在内存中
    2. 重做日志文件(redo log),在磁盘中

当事务提交之后会把所有修改信息存到该日志中。如下:


数据原始状态.png
start transaction;
select balance from bank where name="ls";
// 生成 重做日志 balance=800
update bank set balance = balance - 200; 
// 生成 重做日志 amount=200
update finance set amount = amount + 200;
commit;
redo log过程.png
  • redo log的作用
    mysql 为了提升性能不会把每次的修改都实时同步到磁盘,而是会先存到Boffer Pool(缓冲池)里头,把这个当作缓存来用。然后使用后台线程去做缓冲池和磁盘之间的同步。那么问题来了,如果还没来的同步的时候宕机或断电了怎么办?还没来得及执行上面图中红色的操作。这样会导致丢部分已提交事务的修改信息!所以引入了redo log来记录已成功提交事务的修改信息,并且会把redo log持久化到磁盘,系统重启之后在读取redo log恢复最新数据。

redo log是用来恢复数据的,用于保障,已提交事务的持久化特性。

2. undo log

  • undo log是什么?
    叫做回滚日志,用于记录数据被修改前的信息,与重做日志相反,重做日志记录的是被修改后的信息。undo log主要记录的数据的逻辑变化,为了在发生错误时回滚之前的操作,需将之前的操作都记录下来,然后在发生错误时回滚。
    每次写入数据或者修改数据之前都会把修改前的信息记录到 undo log。


    undo log过程.png
  • undo log的作用
    undo log 记录事务修改之前版本的数据信息,因此假如由于系统错误或者rollback操作而回滚的话可以根据undo log的信息来进行回滚到没被修改前的状态。

undo log是用来回滚数据的用于保障 未提交事务的原子性。

二、mysql锁技术以及MVCC基础

1. mysql锁技术

  • 当有多个请求来读取表中的数据时可以不采取任何操作,但是多个请求里有读请求,又有修改请求时必须有一种措施来进行并发控制。不然很有可能会造成不一致。
  • 读写锁
    解决上述问题很简单,只需用两种锁的组合来对读写请求进行控制即可,这两种锁被称为:
    1. 共享锁(shared lock),又叫做"读锁"
      读锁是可以共享的,或者说多个读请求可以共享一把锁读数据,不会造成阻塞。
    2. 排他锁(exclusive lock),又叫做"写锁"
      写锁会排斥其他所有获取锁的请求,一直阻塞,直到写入完成释放锁。

通过读写锁,可以做到读读可以并行,但是不能做到写读,写写并行,事务的隔离性就是根据读写锁来实现的。

2. MVCC基础

  • MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制。

InnoDB的 MVCC ,是通过在每行记录的后面保存两个隐藏的列来实现的。这两个列, 一个保存了行的创建时间,一个保存了行的过期时间,当然存储的并不是实际的时间值,而是系统版本号。
他的主要实现思想是通过数据多版本来做到读写分离。从而实现不加锁读进而做到读写并行。

  • MVCC在mysql中的实现依赖的是undo log与read view
    1. undo log
      undo log 中记录某行数据的多个版本的数据。
    2. read view
      用来判断当前版本数据的可见性
      提交读级别下的读写锁的使用.png

三、事务的实现

重做日志,回滚日志以及锁技术就是实现事务的基础。

  • 事务的原子性是通过 undo log 来实现的
  • 事务的持久性性是通过 redo log 来实现的
  • 事务的隔离性是通过 (读写锁+MVCC)来实现的
  • 事务的一致性是通过原子性,持久性,隔离性来实现的

原子性,持久性,隔离性的目的是为了保障数据的一致性。ACID只是个概念,事务最终目的是要保障数据的可靠性,一致性。

1. 原子性的实现

什么是原子性:
一个事务必须被视为不可分割的最小工作单位,一个事务中的所有操作要么全部成功提交,要么全部失败回滚,对于一个事务来说不可能只执行其中的部分操作,这就是事务的原子性。--《高性能MySQL》

数据库是怎么实现的呢?就是通过回滚操作。

回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样,所以这时候就需要用到undo log来进行回滚。

1.1 undo log 的生成

undo log过程.png

undo log 的生成.png
  • 根据上面流程可以得出如下结论
    1. 每条数据变更(insert/update/delete)操作都伴随一条undo log的生成,并且回滚日志必须先于数据持久化到磁盘上。
    2. 回滚就是根据回滚日志做逆向操作,比如delete的逆向操作为insert,insert的逆向操作为delete,update的逆向为update等。

1.2 根据undo log 进行回滚

  • 为了做到同时成功或者失败,当系统发生错误或者执行rollback操作时需要根据undo log 进行回滚。


    根据undo log 进行回滚.png
  • 回滚操作就是还原到原来的状态,undo log记录了数据被修改前的信息以及新增和被删除的数据信息,根据undo log生成回滚语句。
    • 如果在回滚日志里有新增数据记录,则生成删除该条的语句。
    • 如果在回滚日志里有删除数据记录,则生成生成该条的语句。
    • 如果在回滚日志里有修改数据记录,则生成修改到原先数据的语句。

2. 持久性的实现

事务一旦提交,其所作做的修改会永久保存到数据库中,此时即使系统崩溃修改的数据也不会丢失。

MySQL的数据存储机制:
MySQL的表数据是存放在磁盘上的,因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。

为了提升性能InnoDB提供了缓冲池(Buffer Pool),Buffer Pool中包含了磁盘数据页的映射,可以当做缓存来使用。

  • 读数据
    会首先从缓冲池中读取,如果缓冲池中没有,则从磁盘读取在放入缓冲池。
  • 写数据
    会首先写入缓冲池,缓冲池中的数据会定期同步到磁盘中。

上面这种缓冲池的措施虽然在性能方面带来了质的飞跃,但是它也带来了新的问题,当MySQL系统宕机,断电的时候可能会丢数据(因为我们的数据已经提交了,但此时是在缓冲池里头,还没来得及在磁盘持久化,所以我们急需一种机制需要存一下已提交事务的数据,为恢复数据使用)。于是就有 redo log了。

事务开始之后就产生redo log,redo log的落盘并不是随着事务的提交才写入的,而是在事务的执行过程中,便开始写入redo log文件中。

redo log也需要存储,也涉及磁盘IO,为什么还使用它?

  • redo log 的存储是顺序存储,而缓存同步是随机操作
  • 缓存同步是以数据页为单位的,每次传输的数据大小大于redo log

3. 隔离性的实现

隔离性是事务ACID特性里最复杂的一个。在SQL标准里定义了四种隔离级别,每一种级别都规定一个事务中的修改,哪些是事务之间可见的,哪些是不可见的。

级别越低的隔离级别可以执行越高的并发,但同时实现复杂度以及开销也越大

Mysql 隔离级别有以下四种(级别由低到高):

  • READ UNCOMMITED (未提交读)
  • READ COMMITED (提交读)
  • REPEATABLE READ (可重复读)
  • SERIALIZABLE (可串行化)

理解了隔离级别以及他的实现原理就相当于理解了ACID里的隔离型。原子性,隔离性,持久性的目的都是为了要做到一致性,但隔离型跟其他两个有所区别,原子性和持久性是为了要实现数据的可性保障靠,比如要做到宕机后的恢复,以及错误后的回滚。隔离性是要管理多个并发读写请求的访问顺序。这种顺序包括串行或者是并行(请求不仅仅是指insert操作,又包括update操作)。

隔离性.png

从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡。

  • 可靠性性高的,并发性能低(比如 Serializable)
  • 可靠性低的,并发性能高(比如 Read Uncommited)

3.1 READ UNCOMMITTED(未提交读)

  • 在READ UNCOMMITTED隔离级别下,事务中的修改即使还没提交,对其他事务是可见的。事务可以读取未提交的数据,造成脏读(因为读不会加任何锁,所以写操作在读的过程中修改数据,所以会造成脏读)。读的操作不能排斥写请求。


    未提交读级别下的读写锁的使用.png
  • 优点
    读写并行,性能高。
  • 缺点
    造成脏读。

3.2 READ COMMITTED (提交读)

  • 一个事务的修改在他提交之前的所有修改,对其他事务都是不可见的。其他事务能读到已提交的修改变化。在很多场景下这种逻辑是可以接受的。
  • InnoDB在 READ COMMITTED,使用排它锁,读取数据不加锁而是使用了MVCC机制(采用了读写分离机制)。
  • 该级别会产生不可重读以及幻读问题。
    1. 不可重读
      • 在一个事务内多次读取的结果不一样。
      • 产生原因
        这跟 READ COMMITTED 级别下的MVCC机制有关系,在该隔离级别下每次 select的时候新生成一个版本号,所以每次select的时候读的不是一个副本而是不同的副本。

在每次select之间有其他事务更新了我们读取的数据并提交了,那就出现了不可重复读。


提交读级别下的读写锁的使用.png

3.3 REPEATABLE READ (可重复读)(Mysql默认隔离级别)

  • 在一个事务内的多次读取的结果是一样的。这种级别下可以避免,脏读,不可重复读等查询问题。mysql 有两种机制可以达到这种隔离级别的效果,分别是采用读写锁以及MVCC。

    1. 采用读写锁实现


      可重复读级别下的读写锁的使用.png
    • 为什么能可重复读?
      只要没释放读锁,在次读的时候还是可以读到第一次读的数据。
    • 优点
      实现起来简单。
    • 缺点
      无法做到读写并行
    1. 采用MVCC实现


      可重复读级别下的读写锁的实现(MVCC).png
    • 为什么能可重复读?
      因为多次读取只生成一个版本,读到的自然是相同数据。
    • 优点
      读写并行。
    • 缺点
      实现的复杂度高

但是在该隔离级别下仍会存在幻读的问题。

3.4 SERIALIZABLE(可串行化)

  • 该隔离级别理解起来最简单,实现也最单。在隔离级别下除了不会造成数据不一致问题,没其他优点。


    可串行化级别下的读写锁的使用.png

3.5 总结

SQL隔离级别.png

4. 一致性的实现

  • 数据库总是从一个一致性的状态转移到另一个一致性的状态。
    1. 假如执行完后之发生异常了,回滚到最初状态。
    2. 假如事务提交之后,缓冲池还没同步到磁盘的时候宕机了,在重启的时候恢复并持久化。
      3 .假如有并发事务请求的时候做好事务之间的可见性问题,避免造成脏读,不可重复读,幻读等。

在涉及并发的情况下往往在性能和一致性之间做平衡,做一定的取舍,所以隔离性也是对一致性的一种破坏

幻读

幻读.png
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,294评论 6 493
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,493评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 157,790评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,595评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,718评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 49,906评论 1 290
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,053评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,797评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,250评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,570评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,711评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,388评论 4 332
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,018评论 3 316
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,796评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,023评论 1 266
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,461评论 2 360
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,595评论 2 350

推荐阅读更多精彩内容