可重复读的实现原理

Mysql默认的事务隔离级别是RR(可重复读),可以避免脏读、不可重复读。那么它的实现原理是什么呢?

MVCC

RR的实现基于Multi-Version Concurrency Control,多版本并发控制。就是说同一时刻数据库中的一条数据可以存在多个版本,而MVCC就是用来控制和管理各个版本数据的手段。它能提高数据库并发能力,较好地处理MySQL的读写冲突,做到尽量不加锁。

MVCC的实现则是基于undo log、read view,下面一一说明。

undo log

定义

undo log 也称回滚日志,是Innodb 存储引擎生成的日志。在数据更新之前,MySQL会先把旧的数据记录到 undo log 日志中,当事务回滚时,可以利用 undo log 来进行回滚。

行的隐藏字段

id ...... trx_id(事务id) roll_pointer(回滚指针)
1 ...... 11 0x10001

在Mysql的数据行中,其实除了我们定义的常规列外,还有两个隐藏字段:trx_id(事务id)、roll_pointer(回滚指针)。

当事务启动时,会被分配一个事务id,之后该事务对数据行进行改动时,会将自己的事务id写入到该行数据的trx_id,同时将旧的数据写入到undo_log中进行记录,并用roll_pointer来指向旧的数据。

read view

事务在创建后,首次生成sq 读取数据的时候会生成 read view 读视图,读视图中包含以下四列:

creator_trx_id m_ids min_trx_id max_trx_id
创建该读视图的事务 id 创建该读视图时数据库中所有活跃的事务id 列表,例如:[11,12] 创建该读视图时,所有活跃事务中最小的事务id 指下一个要创建读视图的事务 id,它并不是m_ids中的最大值,需要加以区分

在RR隔离级别下,read view是在事务开始(begin)之后、执行第一条sql时创建,创建的同时也就生成了一个新的事务id(直到commit结束),事务会依赖其以保证查询结果保持不变直到该事务结束

RR的流程

事务启动后,在首次执行查询时生成了自己的读视图,其中记载了自己的事务id、创建读视图时数据库中的活跃事务列表、创建读视图时的最小事务id、下一个要创建视图的事务id。

之后每次查询时,都会对比数据行中的trx_id与自己的事务id,如果发现数据行中的trx_id比自己的大,说明该数据已被其他事务修改过了,此时事务就会通过数据行的roll_pointer指针到undo_log中去寻找与自己事务id一致的数据快照。

由于事务整个生命周期中,读视图始终不变,因此可以确保同一事务中的每次查询查到的都是自己操作过的数据(无论该事务中是否有DML操作)。

后记

上面的知识点都是通过各平台的一些资料搜罗来的,里面遗漏了很多细节,不能完全讲清楚,而且这部分内容已经比较深了,要完全掌握的话还得细细斟酌。

准备了一些图但效果不理想,就不发出来了,以后有时间再补一补。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容