3分钟了解InnoDB的多版本控制

1 基本概念

在了解MVCC之前,需要了解几个关键的概念

1.1 撤销日志

存储未提交事务修改的数据的副本,可用于:

  1. 事务回滚或者服务崩溃重启时,撤销未提交事务对数据的修改
  2. 用于一致性读

细分之下,撤销日志分别存放在插入撤销缓冲区和更新撤销缓冲区:

  • 插入撤销缓冲区
    存放插入撤销日志,只用于回滚,事务提交后立即丢弃
  • 更新撤销缓冲区
    存放更新撤销日志,不仅用于回滚,也用于一致性读。事务提交并且没有其他事务读快照,才可以丢弃

1.2 回滚段

回滚段就是存储撤销日志的区域,可以在系统表空间、撤销表空间、临时表空间

1.3 一致性读

一致性读指的是一种不加锁,访问快照的读操作,快照数据就是基于撤销日志构建的。
不同的隔离级别下会有一些差别:

  • RR
    在单个事务的生命周期内,只生成一次快照
  • RC
    每一个读请求都会重新生成一份快照

2 InnoDB中的MVCC

InnoDB是一个多版本存储引擎,在回滚段中保存变更记录的旧版本数据,用于支持事务特性

InnoDB内核为每一条记录增加三个属性:

  1. DB_TRX_ID
    6字节,记录最后一个对当前行执行DML操作的事务ID
  2. DB_ROLL_PTR
    7字节,一个指向写入回滚段的撤销日志的指针
  3. DB_ROW_ID
    6字节,插入时单调递增的行ID

InnoDB的MVCC在处理delete时比较特殊,不会物理删除数据,而是在撤销日志被丢弃时对删除的数据做标记,然后有后台线程定期清除

3 MVCC对索引的处理

MVCC对聚集索引和辅助索引的处理方式不同:

  • 聚集索引
    索引直接更新,并且有一个隐藏的列(DB_ROLL_PTR)指向回滚段中的撤销日志
  • 辅助索引
    旧索引做删除状态标记,同时插入新索引,旧的索引最终被后台线程清除

3.1 ICP

ICP(Index Condition Pushdown)是索引作为Where条件时的一种优化。
例如:(zipcode、lastname、firstname)是联合索引

select * from user
    where zipcode = 9527
    and lastname like '%ing%'
    and address like '%ian%'
  • 不使用ICP
    返回zipcode=9527的所有记录,然后再做其他条件的筛选
  • 使用ICP
    返回zipcode=9527的记录前,会去掉不满足lastname的数据

因此,开启ICP,在某些场景下,可以减少返回的数据,从而减少I/O

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容