数据库事务中删除了数据还能查到

问题: 有开发问到,为啥我在一个事务中删除数据没有报错,还能select查到呢? 其实这是隔离级别的原因,不同隔离级别带来的表现是不同的,下面主要给大家介绍下RC和RR隔离级别的一些原理

本文主要介绍RR和RC在事务中如何访问数据的,导语中的这个问题我们在最后会说明原因

首先大家需要先了解一个视图的概念,这个视图并不是指view这种虚拟表,而是指innodb在实现MVCC时用到的一致性读视图,即consistent read view,用于实现RC和RR隔离级别的实现

RR和RC隔离级别下什么时候会产生这个视图呢?

  • RR:事务启动时创建的
    1. 这里需要注意,如果是用begin或者start transaction的方式启动事务的话,需要在执行第一个操作innodb表的语句才会创建这个视图
    2. start transaction with consistent snapshot会直接创建这个一致性视图
  • RC:每个SQL语句开始执行的时候创建的

MVCC中不同隔离级别如何访问数据的

RR和RC隔离级别的区别,先说结论:

  • RR:
    1、针对查询:快照读,以建立的一致性视图为主,只能查看在一致性快照前就已经提交完成的数据
    2、针对变更:先进行当前读在进行变更,每次变更的都是最新的数据
  • RC:
    1、所有都是当前读:只能查看在语句启动前就已经提交完成的数据

怎么判断具体哪些数据是可以访问的呢?这里我们需要了解一下在事务中访问数据时都做了什么操作

  1. innodb 里面每个事务都有一个唯一的事务ID,transaction id,在事务开始时向事务系统申请的递增唯一值
  2. 每次数据更新都会有一个版本,row trx_id,所以每行数据可能会有多个版本,然后多个版本通过undo关联起来,这就是MVCC
  3. RR就是以一致性快照创建的时刻为准,在此时刻前已经提交的,可见,自己事务内执行的数据版本也会认,数据变更需要先获取最新数据
  4. RC就是每个语句执行执行都会进行一次检查,只要是在我这个语句之前的已经提交完成的数据就认

那么问题来了,如果RR级别下,如何判断row trx_id是否可见呢

这里innodb为每个事务都构造了一个数组,用来保存这个一致性快照启动瞬间,当前已经启动未提交的所有事务id,这个数组里面里面最小的事务ID为低水位,事务ID最大值+1是高水位线,低于低水位线的都是提交了的,高于高水位线的都是未来创建的事务,最低水位线和最高水位线之间的row trx_id
如果在这个数组内,则未提交,不在数组内,则提交

数组

一个事务中,哪些数据是可以访问的呢?

  1. 落在绿色区域,证明是在一致性视图创建前已经提交的事务或者自己生成的事务,可见
  2. 落在红色部分,说明是在一致性视图创建后启动的事务,所以不可见
  3. 落在中间部分
    3.1、若 row trx_id 在数组中,表示这个版本是由还没提交的事务生成的,不可见;
    3.2、若 row trx_id 不在数组中,表示这个版本是已经提交了的事务生成的,可见

这里有个误区:
很多人会把这个高水位线当做当前事务的事务id+1,但其实不是的,当前事务如果启动了只做了update操作,也会分配一个事务id,但是此时却不会生成read-view,只有在执行第一个select时才会产生这个一致性视图,此时可能也产生了其他事务,所以这个高水位线还是要理解为创建一致性快照时已经创建过的最大事务id+1

表A,只有id,是主键(如果不是主键RR隔离级别更新就会被锁住了),数据1,2,3,4

时间 事务A 事务B 事务C 事务D
T1 begin;update A set id=5 where id=1;commit; trx:1
T2 begin ;update A set id=6 where id=2; trx:2
T3 begin; update A set id=7 where id=3;commit; trx 3
T4 begin; update A set id=8 where id=4,; trx:4
T4 select * from A

T4时刻事务B生成一致性视图时最低水位线是2,最高水位线就是4+1=5,数组为(2,4)

  • trx1是低于最低水位线,代表已提交,可见
  • trx2是自己更新的,可见
  • trx3不在数组中,可见
  • trx4在数组中,不可见

因此在T4时刻,事务B读到的数据应该就是5,6,7,4

问题解决

我们现在回到开头的问题

问题:开发说在一个事务中删除了一个数据,但是select还能看到

  1. begin;select * from aaa id =1;有一个值
  2. delete from aaa where id=1; 无报错
  3. select * from aaa id =1;还是有那个值

排查原因:开发是多线程并发执行相同的操作,在某个时间点会出现delete语句执行前在另一个事务已经执行完了上述操作,将id=1的值已经删除掉了

时间 事务A 事务B
T1 begin;select * from aaa where id=1;#有值
T2 begin;delete from aaa where id=1;commit;
T3 delete from aaa where id=1;#这里需要注意这种情况出现的时候返回行数为0
T4 select * from aaa where id=1;#有值

原因一目了然

  1. 事务A在T1时刻已经建立了一致性视图,
  2. 事务B在T2时刻删除了id=1的数据并且提交了
  3. 事务A在T3时刻进行delete操作时进行当前读已经没有id=1的数据,所以虽然没有报错但是返回行数为0
  4. 事务A在T4时刻select时相当于还是进行了快照读,因为在T3时刻相当于没有对事务进行任何修改,所以读到还是有数据

所以这种并行操作时遇到这种情况可以结合下返回行数来进行判断,或者隔离级别看是否可以改为RC

本文重点介绍了RR,RC隔离级别下事务内如何访问数据的,一致性快照是何时产生的以及如果结合一致性快照判断哪些数据是可以访问的,水平有限,如有理解问题辛苦各位大佬指正

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容