1 基本概念
在了解MVCC之前,需要了解几个关键的概念
1.1 撤销日志
存储未提交事务修改的数据的副本,可用于:
- 事务回滚或者服务崩溃重启时,撤销未提交事务对数据的修改
- 用于一致性读
细分之下,撤销日志分别存放在插入撤销缓冲区和更新撤销缓冲区:
- 插入撤销缓冲区
存放插入撤销日志,只用于回滚,事务提交后立即丢弃 - 更新撤销缓冲区
存放更新撤销日志,不仅用于回滚,也用于一致性读。事务提交并且没有其他事务读快照,才可以丢弃
1.2 回滚段
回滚段就是存储撤销日志的区域,可以在系统表空间、撤销表空间、临时表空间
1.3 一致性读
一致性读指的是一种不加锁,访问快照的读操作,快照数据就是基于撤销日志构建的。
不同的隔离级别下会有一些差别:
- RR
在单个事务的生命周期内,只生成一次快照 - RC
每一个读请求都会重新生成一份快照
2 InnoDB中的MVCC
InnoDB是一个多版本存储引擎,在回滚段中保存变更记录的旧版本数据,用于支持事务特性
InnoDB内核为每一条记录增加三个属性:
- DB_TRX_ID
6字节,记录最后一个对当前行执行DML操作的事务ID - DB_ROLL_PTR
7字节,一个指向写入回滚段的撤销日志的指针 - DB_ROW_ID
6字节,插入时单调递增的行ID
InnoDB的MVCC在处理delete时比较特殊,不会物理删除数据,而是在撤销日志被丢弃时对删除的数据做标记,然后有后台线程定期清除
3 MVCC对索引的处理
MVCC对聚集索引和辅助索引的处理方式不同:
- 聚集索引
索引直接更新,并且有一个隐藏的列(DB_ROLL_PTR)指向回滚段中的撤销日志 - 辅助索引
旧索引做删除状态标记,同时插入新索引,旧的索引最终被后台线程清除
3.1 ICP
ICP(Index Condition Pushdown)是索引作为Where条件时的一种优化。
例如:(zipcode、lastname、firstname)是联合索引
select * from user
where zipcode = 9527
and lastname like '%ing%'
and address like '%ian%'
- 不使用ICP
返回zipcode=9527的所有记录,然后再做其他条件的筛选 - 使用ICP
返回zipcode=9527的记录前,会去掉不满足lastname的数据
因此,开启ICP,在某些场景下,可以减少返回的数据,从而减少I/O