事务的基本概念
事务的四个特性:
|-- 原子性atomicity,一个事务是不可分割的工作单位,事务中的操作要么都做,要么都不做。
|-- 一致性consistency,事务必须是使数据库从一个一致性状态变到另一个一致性状态,与原子性密切相关。
|-- 隔离性isolation,一个事务的执行不能被其他事务干扰,即一个事务内部操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。
|-- 持久性durability,一个事务一旦提交,它对数据库中数据的改变就应该是永久性的,接下来其他的操作或故障不应该对其有任何影响。
事务的隔离级别:
隔离性:要求一个事务对数据库中数据的修改,在未提交完成前对于其他事务是不可见的。
|-- 未提交读(READ UNCOMMITED)脏读
|-- 已提交读(READ COMMITED)不可重复读
|-- 可重复读(REPEATABLE READ)MySQL默认事务隔离级别
|-- 可串行化(SERIALIZABLE)
事务并发问题:
|-- 脏读:事务A读取了事务B更新的数据,然后B回滚,那么A读取到的数据就是脏数据。
|-- 不可重复读:事务A多次读取同一数据,事务B在A多次读取的过程中,对数据进行了更新并提交,导致事务A多次读取同一数据时,结果不一致。
|-- 幻读:事务A将数据库中所有学生的成绩从具体分数改为ABCDE,事务B在此时插入了一条具体的分数,A改完之后发现还有一条没改过来。
幻读有很多形式:如SELECT了3条数据,UPDATE的时候可能返回了4个成功结果,或者INSERT某条不在的数据时忽然报错说唯一索引冲突等。
RC级别基本不会去用,即便它是由最高的并发度,但是事务能看到别的事务修改且还未提交的脏数据。
Serializable是隔离级别最高的,并发度最低,这里也不需要在理解,那么主要还是RC和RR级别。
RC的问题是不可重复读,一个事务能够看到另一个事物修改且提交后的数据。
RR解决了不可重复度的问题,而SQL规范提到的幻读,也能通过Next-Key lock尽可能的避免。
RC,RR与锁
在InnoDB中,如果通过主键索引或者唯一索引之外的普通索引进行查询时,在RR隔离级别下,会以Next-Key lock的方式对数据进行加锁;RU和RC隔离级别仅仅是行锁,因为间隙锁值存在于RR隔离级别。
MVCC
锁机制可以控制并发操作,来保证一致性,但是系统开销会很大;在RC、RR的隔离级别下,而MVCC可以在大多数情况下代替行级锁,使用MVCC能降低其系统开销.。
MVCC具体体现是在事务并发过程中,SELECT读操作不需要加锁,读写不冲突而提高性能。
MVCC是通过保存数据在某个时间点的快照来实现的。那么如何生成这个快照则与事务ID和Undo Log有关系。
事务版本号:
每开启一个事务,都能从数据库中获取一个事务ID(即事务版本号),这个事务ID是自增长的,通过ID大小也能判断事务的时间顺序。
行记录和隐藏列:
InnoDB的叶子段存储了数据页,数据页中保存了行记录,而行记录中又一些重要的隐藏字段:
|-- db_row_id:隐藏的行ID,用来生成默认的聚集索引,在没有提供主键一个非NULL的唯一索引。
|-- db_tx_id:操作这个数据的事务ID,也就是最后一个对该数据进行插入或者更新的事务ID
|-- db_roll_ptr:回滚指针,也就是指向这个记录的Undo Log信息。
Undo Log
InnoDB将行记录快照放在Undo Log里,使得我们可以在回滚段里找到它们。
Read View
Read View保存了不应该让这个事务看到的其他事务ID的列表,InnoDB中MVCC是通过Read View+Undo Log进行数据读取,Undo Log保存历史快照,而Read View则帮我们判断当前版本的数据是否可见。
对于RR可重复读,查询只承认在事务启动前就已经提交完成的数据;
对于RC读提交,查询只承认在语句启动前就已经提交完成的数据;
所以MVCC可被称为快照读,可以解决了SELECT的问题,但是对于SELECT for update这种当前读方式是不起作用的。
所以MVCC要和Next-Key lock一起才能尽可能避免幻读。