总结
- 四种隔离级别:
读未提交(read uncommitted)RU:数据会读取其他事务未更新到数据的数据。可能会存在脏读、不可重复读、幻读的问题。
读已提交(read committed)RC:数据只能读取其他事务提交的数据,不存在脏读,但是可能会存在不可重复读、幻读的问题。
可重复读(repeatable read)RR:事务执行过程中看到的数据,总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下,未提交的事务对其他事务也是不可见的。不存在脏读、不可重复读,但是可能会存在幻读问题。
串行化(serializable)S:存在读写锁冲突时,后访问的事务会等前一个事务执行完毕后,再继续执行。- MySQL采用了MVVC(多版本并发控制)解决读已提交、可重复读隔离问题。
执行一条SQL语句,都会保存两个隐藏的列。一个是保存创建版本,一个保存过期版本,储存的系统版本号。
每次开启一个事务都会系统会递增一个系统版本号,作为事务的版本号。
select,查询早于当前事务的数据。
insert,添加版本号。
delete,为删除的行把版本号作为删除标识。
update,先插入一条数据,保存当前系统版本号,同时保存原来的行作为行删除标志。
前言
一个事务具有ACID特性,也就是(Atomicity、Consistency、Isolation、Durability,即原子性、一致性、隔离性、持久性),本文主要讲解一下其中的Isolation,也就是事务的隔离性。
隔离性
四种级别
-
读未提交(read uncommitted)RU
一个事务还没提交时,它修改的数据都可以被别的事物看到。 -
读已提交(read committed)RC
一个事务提交之后,它修改的数据才会被别的事物看到。 -
可重复读(repeatable read)RR
一个事务执行过程中看到的数据,总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下,未提交的事务对其他事务也是不可见的。 -
串行化(serializable)S
数据的读和写都会加锁,读会加读锁,写会加写锁。当遇到读写锁冲突时,后访问的事务必须等前一个事务执行完成后,再继续执行。
以上四种隔离级别,由上往下隔离强度越来越大,但是执行效率会随之降低。在设置隔离级别时候,需要在隔离级别和执行效率两者做平衡取舍。
eg:
在不同隔离级别下,事务A会有哪些不同的返回结果,也就是图中的V1、V2、V3的返回值分别是什么。
- 如果隔离级别是读未提交,事务B修改后数据无需提交事务,就能被事务A读取,所以V1、V2、V3的值都是2。
- 如果隔离级别是读已提交,事务B修改后需要提交后,修改后的数据才能被事务A读取,所以V1的值是1,事务B提交,事务A读取修改后的数据,所以V2的值是2,V3的值也是2。
- 如果隔离级别是可重复读,整个事务看到的事务和事务开启时看到的数据是一致的,开启看到的数据是1,所以V1、V2的值都是1,事务A提交之后,获取到修改后的数据,所以V3的值是2。
- 如果隔离级别是串行化,会被锁住,此时事务B对应的线程处于阻塞状态,直到事务A提交之后,事务B才会继续将1改成2。所以V1、V2的值是1,V3的值是2。
MySQL默认的隔离级别是可重复读。
数据不一致现象
三种现象
- 脏读
事务A修改数据,事务B读取了数据后事务A报错回滚,修改的数据没有提交到数据库中,此时事务B读取修改的数据就是一个脏读,也就是一个事务读取到另一个事务未提交的数据就是脏读。 - 不可重复读
事务A在同一个事务上多次读取同一个数据,在事务A还没有结束时,事务B修改了该数据,由于事务B的修改,导致事务A两次读取的数据不一致,就出现了不可以重复读的现象。 - 幻读
事务A根据条件查询得到N条数据,但此时事务B更改或者增加了M条符合事务A查询的条件的数据。这样当事务A再次查询的时候发现会有N + M条数据,产生了幻读。
四种隔离级别对应可以解决什么不一致现象:
- 读未提交(read uncommitted)
数据会读取其他事务未更新到数据的数据。可能会存在脏读、不可重复读、幻读的问题。 - 读已提交(read committed)
数据只能读取其他事务提交的数据,不存在脏读,但是可能会存在不可重复读、幻读的问题。 - 可重复读(repeatable read)
事务执行过程中看到的数据,总是和这个事务开启时看到的数据是一致的。在可重复读的隔离级别下,未提交的事务对其他事务也是不可见的。不存在脏读、不可重复读,但是可能会存在幻读问题。 - 串行化(serializable)
存在读写锁冲突时,后访问的事务会等前一个事务执行完毕后,再继续执行。
隔离级别原理
隔离级别的主要是多版本并发控制MVCC,MVCC是通过保存数据在某个时间点的快照来实现的。
InnoDB实现的MVCC,是通过在每行记录后面保存两个隐藏列来实现,一个是保存行的创建时间,另一个是保存行的过期时间。当然存储的不是时间,而是系统版本号。每开启一个新的事务,系统版本号先自动递增,该系统版本号会作为事务的版本号,用来和查询到的每行记录的版本号做比较。
比如在可重复读隔离级别下,MVCC是如何操作的:
SELECT
InnoDB会根据以下两个条件检查每行记录:
只有符合上述两个条件的记录,才能返回作为查询的结果。
InnoDB只查找版本号早于当前事务的数据行(系统版本号小于或者等于事务的系统版本号),这样可以确保事务读取的行,要么是在事务开始前就存在,要么是事务自身插入或者更新过。
行的删除版本要么未定义,要么大于当前事务版本号。这可以确保事务读取到的行,在事务开始之前未被删除。
INSERT
InnoDB为新插入的每一行保存当前系统版本号作为行版本号。
DELETE
InnoDB为删除的每一行保存当前系统版本号作为行删除的标识。
UPDATE
InnoDB为插入一行新记录,保存当前系统版本号作为行版本号,同时保存当前系统版本号到原来的行作为行删除标识。
保存着两个额外的系统版本号,大多数读操作都可以不用加锁。这样设计是的读数据的操作很简单,性能很好,并且也能保证只会读取到符合标准的行。不足之处是每行记录都需要额外的存储空间,需要做更多的行检查工作,以及一些额外的维护工作。
MVCC只在读已提交和可重复读两个隔离级别下生效。其他两个隔离级别下MVCC都不能生效,因为读未提交总是读取到最新的数据行,无需记录当前事务版本号。而串行化会对所有的读写都会进行加锁,先读、先写的先执行,后读、后写的后执行。也不需要记录记录版本号精心比对。
InnoDB的行数据有多个版本,每个数据版本都有自己的row trx_id,每个事务或者语句都有自己的一致性视图。查询语句是一致性读,一致性读会根据row trx_id和一致性视图确定数据版本的可见性。
可重复读,只查询事务启动前所有事务提交完成的数据。
读已提交,只查询语句启动前(一个事务内可以执行多个语句)所有事务提交完成的数据。