当设置为可重复读(repeatable read)隔离级别时,可以保证当前事务中不因为其他事务对数据进行了修改而出现前后查询结果不一致的问题。
但是这时仍会出现幻读的问题,根据mysql官方文档的解释,The so-called phantom problem occurs within a transaction when the same query produces different sets of rows at different times. For example, if a SELECT is executed twice, but returns a row the second time that was not returned the first time, the row is a “phantom” row
,即多次查询结果中发现结果数据量发生不一致的问题。
举个例子:
#创建数据表并插入数据
drop table if exists tbl;
create table tbl(id int primary key, name varchar(10));
insert into tbl values(1,'aaa'),(2,"bbb"),(3,"ccc");
commit;
#先查看一下数据
select * from tbl;
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
+----+------+
*/
#在两个session中分别配置为可重复读,并开启事务:
set session transaction isolation level repeatable read;
begin;
#在session-1中修改数据,并提交(commit;):
update tbl set name="aaa123" where id=1;
commit;
#在session-1中查询结果:
select * from tbl;
/*
+----+--------+
| id | name |
+----+--------+
| 1 | aaa123 |
| 2 | bbb |
| 3 | ccc |
+----+--------+
*/
#在session-2中查询结果:
select * from tbl;
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
+----+------+
*/
#结束事务
commit;
上面例子中可以看到解决了"不可重复读"的问题
我们再看看"幻读"问题:
#创建数据表并插入数据
drop table if exists tbl;
create table tbl(id int primary key, name varchar(10));
insert into tbl values(1,'aaa'),(2,"bbb"),(3,"ccc");
commit;
#先查看一下数据
select * from tbl;
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
+----+------+
*/
#在两个session中分别配置为可重复读,并开启事务:
set session transaction isolation level repeatable read;
begin;
#在session-1中插入一条新的数据,并提交(commit):
insert into tbl values(4,"ddd");
commit;
#在session-1中查询结果:
select * from tbl;
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
| 4 | ddd |
+----+------+
*/
#在session-2中查询结果:
select * from tbl;
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
+----+------+
*/
#session-2中看不到session-1事务中新插入的数据,似乎没问题
#但是当我们尝试在session-2中新增一个id为4的记录,会发现有异常情况
insert into tbl values(4,"ggg");
/*
ERROR 1062 (23000): Duplicate entry '4' for key 'PRIMARY'
*/
#我们在session-2中尝试更新id为4的数据
#会发现居然可以成功更新一条之前查询不到的id的记录
update tbl set name="ggg" where id=4;
/*
Rows matched: 1 Changed: 1 Warnings: 0
*/
#再次查看session-2的记录
#这时真的可以看到id为4的这条记录
#这条记录就像是幻想一样,直接查询时无法查到,但是却又能通过一些特殊的方法看到
/*
+----+------+
| id | name |
+----+------+
| 1 | aaa |
| 2 | bbb |
| 3 | ccc |
| 4 | ggg |
+----+------+
*/
#结束事务
commit;
大致原因
mysql有两种数据读取机制,即快照读
和当前读
两种读取模式。
当使用select等进行查询时,使用快照读的方式。mysql通过多版本并发控制(mvcc),每个事务看到的都是各自在开启事务前的快照数据,即每个事务操作的都是独属于它自身的一个版本的数据,因此事务之间是互不干扰的,也就是完成了所谓的“可重复读”。
但是当事务commit后,会将数据的修改等操作结果更新到数据库中。如果是简单的select快照读,那么从始至终查看的都只是快照表,这时是不会出问题的。但是如果使用update、insert、delete、for update、lock in share mode等,那么会使用当前读的方式读取数据,即从数据库再次读取最新数据进行操作,此时就会产生一些意料之外的问题。
例如当前事务没有id为4的数据,我们在其他事务中插入了一条id为4的数据,在当前事务中同样使用insert进行插入一条id为4的数据,如果id是主键,会直接提示重复的主键,如果id没有配置主键,那么在事物结束后会发现两天id为4的数据。类似的如果使用update、delete对id=3的数据进行操作,则会将id=4这条记录执行对应的操作。而在此之前我们如果执行select * from tbl where id=4会发现并不存在这条记录。
这就是因为select是快照读,只能看到当前事务拥有的对应版本的数据;而update、delete、insert等是使用的当前读,即读取数据表最新的数据进行处理,因此会发现其他事务中新增加进来的那条id为4的数据。
这也就是幻读产生的原因。