一、什么是事务
数据库中的事务(Transaction)指的是数据库中的一种执行数据库操作的一种机制,事务把一组数据操作作为一个整体一起向系统提交或撤销操作请求,即这一组操作要么全部成功,要么全部失败,不存在部分成功部分失败的情况,所有的额操作共进退,因此事务是一个不可分割的逻辑单元。
二、事务的特性(ACID)
事务有ACID四个特性:原子性(Atomicity)、一致性(Consistency)、隔离性(Isolation)、持久性(Durability)。
原子性:指事务是一个不可分割的最小工作单位,事务中的操作只有都发生和都不发生两种情况。事务中的所有操作必须作为一个整体提交或回滚。如果事务中的任何操作失败,则整个事务将失败。
一致性:事务必须使数据库从一个一致状态变换到另外一个一致状态。也就是说,在事务开始之前,数据库中存储的数据处于一致状态。在正在进行的事务中,数据可能处于不一致的状态,如数据可能有部分被修改。然而,当事务成功完成时,数据必须再次回到另一个确定的一致状态。
隔离性:一个事务的操作对其他事务不可见,即一个事务内部的操作及使用的数据对并发的其他事务是隔离的,并发执行的各个事务之间不能互相干扰。事务之间必须是相互隔离的,它不以任何方式依赖于或影响其他事务。
持久性:一个事务一旦提交成功,它对数据库所作的改变是永久性的,即使系统出现故障也是如此。一旦事务被提交,事务对数据所做的任何变动都会被永久地保留在数据库中。
三、如何实现事务
MySQL 提供了多种存储引擎来支持事务,支持事务的存储引擎有 InnoDB 和 NDB,MyISAM 存储引擎是不支持事务。其中,InnoDB 存储引擎事务主要通过 UNDO 日志和 REDO 日志实现。本文讨论的事务默认都是基于InnoDB存储引擎的。在开启Auto-commit
(默认开启)的情况下,每条 SQL 语句就是一个事务,即SQL 语句执行后自动提交。为了达到将多个操作作为一个事务的目的,需要使用 BEGIN
或START TRANSACTION
显示地开启一个事务,或者关闭当前会话的自动提交。最后使用COMMIT
来显式地提交事务。如果需要撤销当前事务已经执行的操作所有操作,并回到事务执行前的状态,可以是用 ROLLBACK
来进行回滚。ROLLBACK
表示撤销当前事务,即在事务运行的过程中发生了某种故障,事务不能继续执行,系统将事务中对数据库的所有已完成的操作全部撤销,回滚到事务开始时的状态。
MySQL中事务的实现流程大体如下,从BEGIN
或START TRANSACTION
开始,然后执行一系列操作,最后要执行COMMIT
操作来提交事务,事务才算结束。当然,如果需要进行回滚操作,通过执行ROLLBACK
事务也会结束。
四、事务的隔离级别
在介绍事务隔离级别之前,先展示一下在事务并发执行的过程下,可能会遇到的一些问题和场景:
脏读(Dirty Read):事务A读取并使用了另一个事务B修改后尚未提交的数据D, 由于事务B对该数据的修改并未最终提交到数据库,当事务B回滚时,事务A读取到的数据D就是“脏数据”,事务A的这种行为称之为“脏读”,“脏读”会导致事务A后续对数据D的所有操作都会产生无法预期的结果。
修改丢失(Lost of Modify):当事务A读取一个数据D时,另外一个事务B也访问了该数据D,且在事务A成功提交并修改了这个数据D为D1之后,事务B也成功提交并修改了这个数据D为D2。这样事务A对数据D的修改结果就丢失了,这种情况就被称为“修改丢失”。
不可重复读(Unrepeatable Read):事务A需要多次读取同一数据D,在这个事务还没结束时,事务B也访问了这个数据D,并讲这个数据D修改成了D1,此时可能会造成事务A多次读取的数据,这种情况就被称为不可重复读。
幻读(Phantom Read):事务A需要多次读取多行数据D,假设某个阶段读取了N行数据D,此时事务A还没结束,接着事务B插入了n行新数据D,这样事务A在随后的查询中,会读取到N+n行的数据D,就好像发生了幻觉一样,因此这种现象也称之为“幻读”。“幻读”与“不可重复度”类似,“幻读”侧重于数据行数的变化,而“不可重复读”侧重于对同一条数据的内容修改。
事务隔离级别就是用来解决上述可能发生的问题和场景的,MySQL支持全部SQL标准定义的四种隔离级别,分别是:
读取未提交(READ-UNCOMMITTED):最低的隔离级别,允许一个事务去读取另一个事务尚未提交的数据变更,可能造成脏读、修改丢失、不可重复读、幻读。
读取已提交(READ-COMMITTED):只允许读取并发事务已经提交的数据,不允许读取另一个事务尚未提交的数据变更,可以避免脏读和修改丢失,但是可能造成不可重复、幻读。
可重复读(REPEATABLE-READ):在事务中,对同一字段多次读取的结果都是一致的,除非本身事务修改,可以避免脏读、修改丢失和不可重复读,但是无法避免幻读。至于幻读,MySQL的InnoDB采用了间隙锁(Next-Key锁)的方式来解决了幻读问题。
串行化(SERIALIZABLE):最高的隔离级别,完全服从ACID的隔离级别,所以的事务依次执行,可以避免脏读、修改丢失、不可重复读、幻读。但是串行化的执行效率最低,完全没有并发可言。
五、事务隔离的实现
MySQL中不同事务隔离级别的实现都是依靠不同机制的锁来实现的,其实隔离说白了就是枷锁,不然咋隔离。下面针对针对MySQL提供的四种事务的隔离机制,简单介绍一下内部实现原理。
读取未提交(READ-UNCOMMITTED):“读取未提交”是MySQL中安全级别最低的事务隔离级别,基本上就等于没隔离,事务中任何对数据的修改都会第一时间暴露给其他事务,即使当前事务还没有提交甚至可能在后续的操作中被回滚,但是他不管,没一步对数据的改变,都能被其他事务所获取。因为不加锁的原因,所以数据安全无法保证,但是因为没有了加锁和释放锁的所带来的额外开销,因此“读取未提交”的并发性能是最高。
读取已提交(READ-COMMITTED):既然“读取未提交”会导致脏数据,那么如果每个事务只允许读取其他事务已经提交的数据,那么脏数据的问题就可以迎刃而解。“读取已提交”的实现原理是这样的:每个事务在操作某条记录之前开始获取锁,如果当前有其他事务已经获取了该条记录的锁,那么该事务获取锁失败,就等待另外是个事务释放锁。当持有该记录锁的事务提交完成之后,锁释放,此时新的事务才能获取当前记录的锁,并对当前数据进行操作。在这种隔离级别下,由于事务的中间状态不被其他事务所感知,所以可以很好的解决脏读和修改丢失的问题。
可重复读(REPEATABLE-READ):“可重复度”是MySQL默认的事务隔离级别,“可重复读”是针对“不可重复读”而言的,前面我们说到过,“不可重复读”是指同一事务在不同时刻读到的某挑记录的内容可能不一致。而“可重复读”指的是:事务不会读到其他事务对已有数据的修改,即使其他事务已提交,也就是说,事务开始时读到的已有数据是什么,在事务提交前的任意时刻,这些数据的值都是一样的。但是,对于其他事务新插入的数据是可以读到的,这也就引发了幻读问题。
为了实现可重复读,MySQL 采用了MVCC(Multi-Version Concurrency Control,多版本并发控制)的方式,MVCC 在 MySQL InnoDB 中的实现主要是为了提高数据库并发性能,用更好的方式去处理读写冲突,做到即使有读写冲突时,也能做到不加锁,非阻塞并发读。
串行化(SERIALIZABLE):串行化是四种种事务隔离级别中隔离要求最严格的,它解决了脏读、可重复读、幻读的问题,但是并发效果是最差的,因为它将多个并发事务的执行变为顺序执行。读的时候加共享锁,其他事务可以并发读但是不能写。写的时候加排它锁,其他事务既不能并发读也不能并发写。