ACID模型
MYSQL传统关系数据库的ACID模型有以下特性
- Atomicity原子性:一个事务中所有操作都必须全部完成,要么全部不完成。
- Consistency一致性. 在事务开始或结束时,数据库应该在一致状态。
- Isolation隔离性. 事务将假定只有它自己在操作数据库,彼此不知晓。
- Durability持久性.一旦事务完成,就不能返回。
MYSQL-ACID模型的实现原理如下
- 事务的原子性是通过 undo log 来实现的
- 事务的持久性性是通过 redo log 来实现的
- 事务的隔离性是通过 (读写锁+MVCC)来实现的
- 而事务的终极大 boss 一致性是通过原子性,持久性,隔离性来实现的!!!
下面就逐一介绍其实现原理
原子性(Atomicity)原理
一个事务必须被视为不可分割的最小工作单位,一个事务中的所有操作要么全部成功提交,要么全部失败回滚,对于一个事务来说不可能只执行其中的部分操作,这就是事务的原子性。
数据库是通过回滚操作来实现原子性的。 所谓回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样,所以这时候就需要用到undo log来进行回滚。undo log 就是用于记录更新或新增操作之前的数据状态,当出现需要回滚的情况时,将原数据刷回到数据库中,从而保证操作的原子性,具体实现方式如下:
上面从银行账户转账到理财账户的操作步骤如下
- 1.事务开始
- 2.查询数据
- 3.进行update操作,balance=balance-400;
- 4.记录zhangsan(1000)到undo log 日志中,回滚时需要将数据更新回来
- 5.进行update操作,amount=amount+400;
- 6.记录amount(0)到undo log日志中,回滚的时候需要将数据刷新回来
- 7.事务提交/回滚
持久性(Durability)原理
事务一旦提交,其所作做的修改会永久保存到数据库中,此时即使系统崩溃修改的数据也不会丢失。
MySQL的数据存储,表数据是存放在磁盘上的,因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。 为此,为了提升性能InnoDB提供了缓冲池(Buffer Pool),Buffer Pool中包含了磁盘数据页的映射,可以当做缓存来使用:
- 读数据:会首先从缓冲池中读取,如果缓冲池中没有,则从磁盘读取在放入缓冲池;
- 写数据:会首先写入缓冲池,缓冲池中的数据会定期同步到磁盘中;
上面这种缓冲池的措施虽然在性能方面带来了质的飞跃,但是它也带来了新的问题,当MySQL系统宕机,断电的时候可能会丢数据!因为我们的数据已经提交了,但此时是在缓冲池里头,还没来得及在磁盘持久化,所以我们急需一种机制需要存一下已提交事务的数据,为恢复数据使用。redo log就派上用场了。
redo log来记录已成功提交事务的修改信息,并且会把redo log持久化到磁盘,系统重启之后在读取redo log恢复最新数据。
隔离性(Isolation)原理
Mysql 隔离级别有以下四种(级别由低到高):
- READ UNCOMMITED (读未提交)
- READ COMMITED (读提交)
- REPEATABLE READ (可重复读)
- SERIALIZABLE (串行化)
隔离性是要管理多个并发读写请求的访问顺序。 这种顺序包括串行或者是并行,从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡,可靠性性高的,并发性能低(比如 Serializable),可靠性低的,并发性能高(比如 Read Uncommited),不同的隔离级别会有不同的问题
- | 脏读 | 不可重复读 | 幻读 |
---|---|---|---|
读未提交 | √ | √ | √ |
读已提交 | × | √ | √ |
不可重复读 | × | × | √ |
串行化 | × | × | × |
- 脏读:事务中读取到了其他事务没有提交的数据,主要是读写完全没有加锁造成的
- 不可重复读:事务中多次读取结果不一致,因为多次读取中间,其他事务修改并提交了数据(主要原因是修改)
- 幻读:事务中多次范围读取结果不一致,因为多次读取中间,其他事务修改并提交了数据(主要原因是新增/删除)
读未提交(READ UNCOMMITED)
:在该隔离级别下,事务中的修改即使还没提交,对其他事务是可见的。其他事务可以读取其未提交的数据,造成脏读。
:因为读不会加任何锁,所以写操作在读的过程中修改数据,所以会造成脏读。好处是可以提升并发处理性能,能做到读写并行。
读提交(READ COMMITTED)
:在该隔离级别下,事务中的修改如果还没提交,对其他事务是不可见的。不会造成脏读,但是多次读取会造成数据不一致的情况,会有不可重复度的问题,例如:一个事务中两次读取,在这中间他事务进行了一个更新并提交,那么两次读取的内容会不一样。
:InnoDB在该隔离级别下读取数据不加锁而是使用了MVCC机制(详情如下)
可重复读 (REPEATABLE READ)
Mysql隔离级别。在一个事务内的多次读取的结果是一样的。这种级别下可以避免,脏读,不可重复读等查询问题,Innodb可以解决还可以解决幻读问题。Mysql 有两种机制可以达到这种隔离级别的效果,分别是采用读写锁和MVCC机制来实现。
- 采用MVCC的实现:使用
的方式支持并行读写并行内部使用MVCC原理(后面介绍)
- 采用锁的实现:使用
对于SELECT... FOR UPDATE ,SELECT ... LOCK IN SHARE MODE 等情况使用的是加锁解决机制(记录锁,间隙锁等实现)
串行化(SERIALIZABLE)
- 该隔离级别理解起来最简单,实现也最单。在隔离级别下除了不会造成数据不一致问题,没其他优点。
MVCC (多版本控制)
MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制,主要是针对事务中并行普通读取的优化。
InnoDB在实现的 MVCC的时候使用一致性视图来保证RC(读提交),和RR(可重复读)事务隔离级别的实现 ,是事务开启时,对整个库创建快照(read view),是通过每行记录的后面保存两个隐藏的列来实现的。这两个列, 一个保存了行的创建时间,一个保存了行的过期时间, 当然存储的并不是实际的时间值,而是系统版本号。每当修改数据时,版本号加一。当事务读取时,如果数据的当前版本号大于自己的事务,则查询的时候抛弃。从而实现不加锁读进而做到读写并行。MVCC在mysql中的实现依赖的是undo log与read view
- undo log :undo log 中记录某行数据的多个版本的数据。
- read view :用来判断当前版本数据的可见性
在不同的隔离级别下,MVCC创建read view历史版本的时机也是不同的
- 在读提交隔离级别下:视图 read-view的创建是在语句执行的时候创建的
- 在可重复读隔离级别下:视图 read-view的创建是在事务启动的时候创建的
幻读问题详解
幻读在业务中存在两种情况,快照读,和当前读,MVCC策略能够解决快照读的问题,但是对于当前读则需要使用间隙锁。是指读取数据库中最新版本的数据,在多个update的时候不能基于快照读。读取历史版本的数据进行更新,会导致数据不一致问题
- 快照读:当使用普通select * 进行统计的时候,使用MVCC可以保证幻读问题
- 当前读:当使用select for update 或者 select ... lock in share mode 操作的时候,insert,update,delete等操作都会被阻塞。当前读是通过手动加record lock(记录锁)和gap lock(间隙锁 )来实现的