MYSQL（02）-事务原理

ACID模型

MYSQL传统关系数据库的ACID模型有以下特性

Atomicity原子性：一个事务中所有操作都必须全部完成，要么全部不完成。
Consistency一致性. 在事务开始或结束时，数据库应该在一致状态。
Isolation隔离性. 事务将假定只有它自己在操作数据库，彼此不知晓。
Durability持久性.一旦事务完成，就不能返回。

MYSQL-ACID模型的实现原理如下

事务的原子性是通过 undo log 来实现的
事务的持久性性是通过 redo log 来实现的
事务的隔离性是通过 (读写锁+MVCC)来实现的
而事务的终极大 boss 一致性是通过原子性，持久性，隔离性来实现的！！！

下面就逐一介绍其实现原理

原子性（Atomicity）原理

一个事务必须被视为不可分割的最小工作单位，一个事务中的所有操作要么全部成功提交，要么全部失败回滚，对于一个事务来说不可能只执行其中的部分操作，这就是事务的原子性。

数据库是通过回滚操作来实现原子性的。所谓回滚操作就是当发生错误异常或者显式的执行rollback语句时需要把数据还原到原先的模样，所以这时候就需要用到undo log来进行回滚。undo log 就是用于记录更新或新增操作之前的数据状态，当出现需要回滚的情况时，将原数据刷回到数据库中，从而保证操作的原子性，具体实现方式如下：

上面从银行账户转账到理财账户的操作步骤如下

1.事务开始
2.查询数据
3.进行update操作，balance=balance-400;
4.记录zhangsan（1000）到undo log 日志中，回滚时需要将数据更新回来
5.进行update操作，amount=amount+400；
6.记录amount（0）到undo log日志中，回滚的时候需要将数据刷新回来
7.事务提交/回滚

持久性（Durability）原理

事务一旦提交，其所作做的修改会永久保存到数据库中，此时即使系统崩溃修改的数据也不会丢失。
MySQL的数据存储，表数据是存放在磁盘上的，因此想要存取的时候都要经历磁盘IO,然而即使是使用SSD磁盘IO也是非常消耗性能的。为此，为了提升性能InnoDB提供了缓冲池(Buffer Pool)，Buffer Pool中包含了磁盘数据页的映射，可以当做缓存来使用：

读数据：会首先从缓冲池中读取，如果缓冲池中没有，则从磁盘读取在放入缓冲池；
写数据：会首先写入缓冲池，缓冲池中的数据会定期同步到磁盘中；

上面这种缓冲池的措施虽然在性能方面带来了质的飞跃，但是它也带来了新的问题，当MySQL系统宕机，断电的时候可能会丢数据！因为我们的数据已经提交了，但此时是在缓冲池里头，还没来得及在磁盘持久化，所以我们急需一种机制需要存一下已提交事务的数据，为恢复数据使用。redo log就派上用场了。

redo log来记录已成功提交事务的修改信息，并且会把redo log持久化到磁盘，系统重启之后在读取redo log恢复最新数据。

隔离性（Isolation）原理

Mysql 隔离级别有以下四种（级别由低到高）：

READ UNCOMMITED (读未提交)
READ COMMITED (读提交)
REPEATABLE READ (可重复读)
SERIALIZABLE (串行化)

隔离性是要管理多个并发读写请求的访问顺序。这种顺序包括串行或者是并行，从隔离性的实现可以看出这是一场数据的可靠性与性能之间的权衡，可靠性性高的，并发性能低(比如 Serializable)，可靠性低的，并发性能高(比如 Read Uncommited)，不同的隔离级别会有不同的问题

-	脏读	不可重复读	幻读
读未提交	√	√	√
读已提交	×	√	√
不可重复读	×	×	√
串行化	×	×	×

脏读：事务中读取到了其他事务没有提交的数据，主要是读写完全没有加锁造成的
不可重复读：事务中多次读取结果不一致，因为多次读取中间，其他事务修改并提交了数据（主要原因是修改）
幻读：事务中多次范围读取结果不一致，因为多次读取中间，其他事务修改并提交了数据（主要原因是新增/删除）

读未提交（READ UNCOMMITED）

$\color{red}{概念}$ ：在该隔离级别下，事务中的修改即使还没提交，对其他事务是可见的。其他事务可以读取其未提交的数据，造成脏读。 $\color{red}{原理}$ ：因为读不会加任何锁，所以写操作在读的过程中修改数据，所以会造成脏读。好处是可以提升并发处理性能，能做到读写并行。

读提交（READ COMMITTED）

$\color{red}{概念}$ ：在该隔离级别下，事务中的修改如果还没提交，对其他事务是不可见的。不会造成脏读，但是多次读取会造成数据不一致的情况，会有不可重复度的问题，例如：一个事务中两次读取，在这中间他事务进行了一个更新并提交，那么两次读取的内容会不一样。 $\color{red}{原理}$ ：InnoDB在该隔离级别下读取数据不加锁而是使用了MVCC机制（详情如下）

可重复读（REPEATABLE READ）

Mysql $\color{red}{默认}$ 隔离级别。在一个事务内的多次读取的结果是一样的。这种级别下可以避免，脏读，不可重复读等查询问题，Innodb可以解决还可以解决幻读问题。Mysql 有两种机制可以达到这种隔离级别的效果，分别是采用读写锁和MVCC机制来实现。

采用MVCC的实现：使用 $\color{red}{快照读}$ 的方式支持并行读写并行内部使用MVCC原理（后面介绍）
采用锁的实现：使用 $\color{red}{当前读}$ 对于SELECT... FOR UPDATE ，SELECT ... LOCK IN SHARE MODE 等情况使用的是加锁解决机制（记录锁，间隙锁等实现）

串行化（SERIALIZABLE）

该隔离级别理解起来最简单，实现也最单。在隔离级别下除了不会造成数据不一致问题，没其他优点。

MVCC （多版本控制）

MVCC (MultiVersion Concurrency Control) 叫做多版本并发控制，主要是针对事务中并行普通读取的优化。
InnoDB在实现的 MVCC的时候使用一致性视图来保证RC（读提交），和RR（可重复读）事务隔离级别的实现， $\color{red}{原理}$ 是事务开启时，对整个库创建快照（read view），是通过每行记录的后面保存两个隐藏的列来实现的。这两个列，一个保存了行的创建时间，一个保存了行的过期时间，当然存储的并不是实际的时间值，而是系统版本号。每当修改数据时，版本号加一。当事务读取时，如果数据的当前版本号大于自己的事务，则查询的时候抛弃。从而实现不加锁读进而做到读写并行。MVCC在mysql中的实现依赖的是undo log与read view

undo log :undo log 中记录某行数据的多个版本的数据。
read view :用来判断当前版本数据的可见性

在不同的隔离级别下，MVCC创建read view历史版本的时机也是不同的

在读提交隔离级别下：视图 read-view的创建是在语句执行的时候创建的
在可重复读隔离级别下：视图 read-view的创建是在事务启动的时候创建的

幻读问题详解

幻读在业务中存在两种情况，快照读，和当前读，MVCC策略能够解决快照读的问题，但是对于当前读则需要使用间隙锁。 $\color{red}{当前读}$ 是指读取数据库中最新版本的数据，在多个update的时候不能基于快照读。读取历史版本的数据进行更新，会导致数据不一致问题

快照读：当使用普通select * 进行统计的时候，使用MVCC可以保证幻读问题
当前读：当使用select for update 或者 select ... lock in share mode 操作的时候，insert，update，delete等操作都会被阻塞。当前读是通过手动加record lock(记录锁)和gap lock(间隙锁 )来实现的

MYSQL（02）-事务原理