可重复读的实现原理

Mysql默认的事务隔离级别是RR（可重复读），可以避免脏读、不可重复读。那么它的实现原理是什么呢？

MVCC

RR的实现基于Multi-Version Concurrency Control，多版本并发控制。就是说同一时刻数据库中的一条数据可以存在多个版本，而MVCC就是用来控制和管理各个版本数据的手段。它能提高数据库并发能力，较好地处理MySQL的读写冲突，做到尽量不加锁。

MVCC的实现则是基于undo log、read view，下面一一说明。

undo log

定义

undo log 也称回滚日志，是Innodb 存储引擎生成的日志。在数据更新之前，MySQL会先把旧的数据记录到 undo log 日志中，当事务回滚时，可以利用 undo log 来进行回滚。

行的隐藏字段

id	......	trx_id（事务id）	roll_pointer（回滚指针）
1	......	11	0x10001

在Mysql的数据行中，其实除了我们定义的常规列外，还有两个隐藏字段：trx_id（事务id）、roll_pointer（回滚指针）。

当事务启动时，会被分配一个事务id，之后该事务对数据行进行改动时，会将自己的事务id写入到该行数据的trx_id，同时将旧的数据写入到undo_log中进行记录，并用roll_pointer来指向旧的数据。

read view

事务在创建后，首次生成sq 读取数据的时候会生成 read view 读视图，读视图中包含以下四列：

creator_trx_id	m_ids	min_trx_id	max_trx_id
创建该读视图的事务 id	创建该读视图时数据库中所有活跃的事务id 列表，例如：[11,12]	创建该读视图时，所有活跃事务中最小的事务id	指下一个要创建读视图的事务 id，它并不是m_ids中的最大值，需要加以区分

在RR隔离级别下，read view是在事务开始（begin）之后、执行第一条sql时创建，创建的同时也就生成了一个新的事务id（直到commit结束），事务会依赖其以保证查询结果保持不变直到该事务结束

RR的流程

事务启动后，在首次执行查询时生成了自己的读视图，其中记载了自己的事务id、创建读视图时数据库中的活跃事务列表、创建读视图时的最小事务id、下一个要创建视图的事务id。

之后每次查询时，都会对比数据行中的trx_id与自己的事务id，如果发现数据行中的trx_id比自己的大，说明该数据已被其他事务修改过了，此时事务就会通过数据行的roll_pointer指针到undo_log中去寻找与自己事务id一致的数据快照。

由于事务整个生命周期中，读视图始终不变，因此可以确保同一事务中的每次查询查到的都是自己操作过的数据（无论该事务中是否有DML操作）。

后记

上面的知识点都是通过各平台的一些资料搜罗来的，里面遗漏了很多细节，不能完全讲清楚，而且这部分内容已经比较深了，要完全掌握的话还得细细斟酌。

准备了一些图但效果不理想，就不发出来了，以后有时间再补一补。

可重复读的实现原理

MVCC

undo log

定义

行的隐藏字段

read view

RR的流程

后记

推荐阅读更多精彩内容