事务的ACID
- 原子性(A),事务中所有的数据操作都执行成功或者逻辑上都没有执行(可能执行了但是被回滚了)
- 一致性(C), 一致性指事务将数据库从一种状态转换为下一种一致的状态。事务的执行不应该改变数据库的完整性约束。
- 隔离性(I), 每个读写事务对其他事务隔离。事务中未提交的修改不能被其他事务读取。
- 持久性(D),事务提交后所有的改变都是永久的。数据库宕机后,也能保证恢复后提交的数据不会丢失。
事务的分类
- 扁平事务:一般认知中的事务,要么都执行成功,要么全部回滚。
- 带有保存点的扁平事务:可以回滚到特定的保存点。
- 链式事务
- 嵌套事务:嵌套事务的子事务不具备持久性(子事务提交后,可能被其父事务的回滚而影响)
- 分布式事务:一个事务涉及不止一个数据库(如转账:A库某卡减钱,B库某卡加钱)
事务的实现
- 事务的ACID是通过redo 和 undolog实现的。
- redo 用来保证事务的持久性。
- undo 提供事务的回滚 和MVCC功能。
redo log
- redo log记录的是页的物理修改,所以恢复时很快。
- 重做日志缓冲 每秒都会写到 重做日志文件
- 事务提交时,要求先将事务的所有日志刷到重做日志文件(默认fsync会调用)
- lsn :
lsn记录的是重做日志的总量,单位为字节。每个页中还记录了lsn值(该页最后刷新时lsn的大小),可以用于决定该页是否需要恢复操作。
show engine innodb status
中的 last checkpoint at 值为刷新到磁盘的lsn值。
例如 数据库刚重启时:last checkpoint at = 1000; 而log flushed up to = 1500(写到重做日志的lsn), 页A的lsn(头部信息) 为1100。那么从1000到1500部分的lsn是需要遍历处理的,如果其中有页A的已提交事务操作,那么需要将该事务操作应用到当前页A(物理恢复),并更新其 lsn值。
undo log
- 用于支持事务回滚和MVCC
- undo段默认位于共享表空间。
- 通过undo段的恢复是逻辑恢复,如insert对应delete.
- 事务提交后不能马上purge或删除相应undo页(其他事务可能需要老版本数据-一致性读)
事务控制语句
start transaction|begin or cmd set autocommit=0;
commit;commit work;
rollback; rollback work;
savepoint identifier;
release savepoint identifier;
rollback to [savepoint] identifier;
set transaction;//设置事务隔离级别
- 其中 commit work 来控制事务结束后的行为是chain(链事务-当前事务结束并且马上开始一个同隔离级别的事务)还是release(释放连接). 由参数(completion_type值决定:0默认不做啥,1:chain,2:release)
- rollback to savepoint 执行后事务并未结束,仍然需要commit或者rollback.
隐式提交的SQL语句
- truncate table是DDL语句(删除全表数据),不能被回滚,而delete可以被回滚
- 其他,注意有这会事就行
事务TPS
- TPS:每秒事务处理的能力,QPS(每秒请求数)
- Com_commit: 显示方式提交事务数。Handler_commit代表隐式提交事务数(
show global status like '%commit%';
) - Com_rollback 和 Handler_rollback 同上
- TPS计算: (com_commit + Handler_commit + com_rollback + Handler_rollback )/time;
事务的隔离级别
- 可重复读的隔离级别下,使用了Next-Key Lock算法解决幻读问题,所以InnoDB的可重复读可以一定程度上等于标准中定义的可序列化
- serilizable 与repeatable read 和 read committed之间没有多少性能差距
- 设置隔离级别命令
set [global|session] tansaction isolation level{
read committed
| read uncommitted
| repeatable read
| serializable
}
[mysqld]
transaction-isolation=read-committed
select @@tx_isolation\G;
- 对于serializable 隔离级别,其实是在每条一致性非锁定读语句加上S锁,这种隔离级别主要用于分布式事务(why)
- 老版本中 read committed隔离级别只能binlog的format为row,否则会报错(因为statement格式下可能主从数据库不一致)。例子如下
Session A : delete * from a where b < 5;//这里提交读隔离级别下没有lock 所以下面插入不会被阻塞。
Session B: insert into a select 3;
Session B commit; Session A commit;
以上面例子执行完成之后,数据库中由b为3的记录。但是如果binlog格式为statement,从库中就不会有b为3的那条记录(事务B先提交)。当然如果binlog format为 row或者 隔离级别为 repeatable read 就可以避免上面的问题, 同时也回答了前面阅读中的binlog format 为row时,事务隔离级别可以为read committed的疑问