mvcc详解

1 为什么需要MVCC

  • 用来进行事务回滚操作;

  • 有事务存在读写冲突时,也能做到不加锁,非阻塞并发读

2 undolog

2.1 undolog定义

在InnoDB中的每一条记录实际都会存在三个隐藏列:

  • DB_TRX_ID:事务 ID,是根据事务产生时间顺序自动递增的,是独一无二的。如果某个事务执行过程中对该记录执行了增、删、改操作,那么InnoDB存储引擎就会记录下该条事务的 id。

  • DB_ROLL_PTR:回滚指针,本质上就是一个指向记录对应的undo log的一个指针,InnoDB 通过这个指针找到之前版本的数据

  • DB_ROW_ID:主键,如果有自定义主键,那么该值就是主键;如果没有主键,那么就会使用定义的第一个唯一索引;如果没有唯一索引,那么就会默认生成一个隐藏列作为主键。

image.png

版本V1、V2并不是物理上真实存在的,而是每次需要的时候根据当前版本和undo log计算出来的。比如,需要V1的时候,就是通过V3依次执行U2、U1算出来。

可以将这些 undo 日志都连起来,串成一个链表,形成版本链。版本链的头节点就是当前记录最新的值。

2.2 undo log分类

  • Insert undo log :insert生成的日志,仅在事务回滚中需要,并且可以在事务提交后立即丢弃。

  • Update undo log:update/delete生成的日志,除了用于事务回滚,还用于一致性读取,只有不存在innodb为其分配快照的事务之后才能丢弃它们,在一致读取中可能需要update undo log中的信息来构建数据库行的早期版本。

2.3 数据删除

删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的

purge线程作用

1、清理undo log

2、清除page里面带有Delete_Bit标识的数据行。在InnoDB中,事务中的Delete操作实际上并不是真正的删除掉数据行,而是一种Delete Mark操作,在记录上标识删除,真正的删除工作需要后台purge线程去完成。

2.4 更新主键

聚簇索引和二级索引都无法进行in place update,都会产生两个版本

update分两步执行,先删除该行,再插入一行目标行

image.png

2.5 更新非主键

聚簇索引可以in place update,二级索引产生两个版本

聚簇索引记录undo log,二级索引不记录undo log

更新二级索引,同时需要判断是否修改索引页面的MAX_TRX_ID


image.png

2.6 删除操作

删除操作实际上不会直接删除,而只是标记为删除,最终的删除操作是purge线程完成的

image.png

3 Read View

Read View是InnoDB在实现MVCC时用到的一致性读视图,用于支持读提交和可重复读隔离级别的实现,作用是执行期间判断版本链中的哪个版本是当前事务可见的。

本质上是InnoDB为每个事务构造了一个数组,用来保存当前正在活跃(启动了但还没提交)的所有事务ID。

数组里面事务ID的最小值记为低水位,当前系统里面已经创建过的事务ID的最大值加1记为高水位;这个视图数组和高水位,就组成了当前事务的一致性视图(read-view)。

对于以上事务:

  1. 如果在「已提交事务」部分,表示这个版本是已提交的事务或者是当前事务自己生成的,这个数据对当前事务是可见的;

  2. 如果落在「未开启事务」部分,表示这个版本是由将来启动的事务生成的,是肯定不可见的;

  3. 如果落在「未提交」部分,那就包括两种情况
    a. 若当前版本的trx_id在一致性试图中,表示这个版本是由还没提交的事务生成的,不可见;
    b. 若当前版本的trx_id不在一致性试图中,表示这个版本是已经提交了的事务生成的,可见。

3 MVCC的工作原理

3.1 MVCC查询的工作流程

3.1.1 查询主键索引

生成Read View读视图

通过主键查找记录,根据记录里的DB_TRX_ID与Read View读视图进行可见性判断

配合DB_ROLL_PTR回滚指针和undo log来找到当前事务可见的数据记录

3.1.2 查询二级索引

由于二级索引由于没有三个隐藏列(DB_TRX_ID,DB_ROLL_PTR,DB_ROW_ID)如何实现一致读,可重复读?

更新二级索引列时,旧的二级索引记录将被删除标记(并非真正的删除),新记录将被插入;

如果二级索引记录被标记为删除,或者二级索引页被更新的事务更新,则不使用覆盖索引技术(要通过聚族索引查找正确版本)。

如果启用了索引条件下推(ICP)优化,首先会通过索引下推过滤掉不符合要求的行,来避免使用聚集索引查找。如果找到匹配的记录,即使在删除标记的记录中,InnoDB也会在聚集索引中查找该记录。

具体查询步骤:

  • 生成Read View读视图

  • 比较读视图的up_limit_id与MAX_TRX_ID大小

    • 如果MAX_TRX_ID **小于 **本次Read View的up_limit_id,则全部可见,过滤记录中的有效记录

    • 否则,无法通过二级索引判断可见性,需要一次遍历每条记录,反查到聚簇索引记录,通过聚簇索引记录来判断可见性

3.2 MVCC与隔离级别

MVCC 只在 **Read Commited(读已提交) 和 Repeatable Read(可重读读) **两种隔离级别下工作。

  • 在RC隔离级别下,是每个快照读都会生成并获取最新的Read View,这就是我们在RC级别下的事务中可以看到别的事务提交的更新的原因

  • 在RR隔离级别下,则是同一个事务中的第一个快照读才会创建Read View, 之后的快照读获取的都是同一个Read View,从而做到可重复读

3.3 mvcc能否解决幻读

幻读:在一次事务里面,多次查询之后,结果集的个数不一致的情况叫做幻读。而多出来或者少的哪一行被叫做幻行。

  • 在快照读读情况下,mysql通过mvcc来避免幻读。

  • 在当前读读情况下,mysql通过next-key来避免幻读。

  • 不能把快照读和当前读得到的结果不一样这种情况认为是幻读,这是两种不同的使用。所以mysql的rr级别是解决了幻读的。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,319评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,801评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,567评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,156评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,019评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,090评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,500评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,192评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,474评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,566评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,338评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,212评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,572评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,890评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,169评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,478评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,661评论 2 335

推荐阅读更多精彩内容

  • Innodb-MVCC详解 借用高性能 MySQL 的几句话 MySQL 的大多数事务型存储引擎都不是简单的行级锁...
    mago_dg阅读 1,241评论 0 1
  • 1 mvcc是什么? 阿里数据库内核2017/12月报多版本控制: 指的是一种提高并发的技术。最早的数据库系统,只...
    Aaron_Swartz阅读 15,268评论 0 7
  • 1. MVCC的基本概念 1.1 三种数据库并发场景 读-读:不存在任何问题,也不需要并发控制 读-写:有线程安全...
    小青菜的技术博客阅读 4,651评论 1 41
  • 最近要在公司内做一次技术分享,思来想去不知道该分享些什么,最后在朋友的提示下,准备分享一下MySQL的InnoDB...
    阿Q说代码阅读 565评论 0 3
  • 深入了解MVCC数据库并发控制 问题: 我们知道这个是因为数据库的隔离级别,那到底是怎么实现的呢?思考这个问题的同...
    e0e180156aa8阅读 2,514评论 0 8