在文章的开始,简单思考一个小问题:假如有一个SQL语句delete from T where id = 1
,这条SQL在InnoDB中执行的时候数据库如何加锁的?
数据库的锁
要回答上面的问题,首先我们要知道数据库的锁到底是什么。首先InnoDB数据库的锁级别有表级锁,页级锁,行级锁。
X锁与S锁
对于行级锁来说有两种:排它锁X、共享锁S。这两种锁的兼容性如下:
锁 | X | S |
---|---|---|
X | 不兼容 | 不兼容 |
S | 不兼容 | 兼容 |
可以看到假如一个事务获取了某行数据的X锁,则其它事务就不能获取该行数据的X、S锁了,必须等待前面一个事务释放X锁才可以获取自己想要的锁。但是如果一个事务获取了某行数据的S锁,则其它事务是可以获取该数据的S锁的,但是不能获取X锁。也就是说S锁只与S锁兼容。X锁与任何锁都不兼容。
IX锁与IS锁
数据库为了实现不同粒度的锁的共存,引入了意向锁的概念。意向锁是表级锁,解释为事务在当前表的记录上所需要的锁(S、X)。相应的意向锁就有意向排它锁、意向共享锁。数据库结构如下:
假如有一个事务需要对记录1进行加X锁,则它需要先对页、表、数据库层面加上IX锁。如果遇到不兼容则需要等待其它事务释放锁。意向锁的兼容性如下:
锁 | X | S | IX | IS |
---|---|---|---|---|
X | 不兼容 | 不兼容 | 不兼容 | 不兼容 |
S | 不兼容 | 兼容 | 不兼容 | 兼容 |
IX | 不兼容 | 不兼容 | 兼容 | 兼容 |
IS | 不兼容 | 兼容 | 兼容 | 兼容 |
可以看出意向锁和意向锁之间是兼容的,这也就解释了为何InnoDB不会有表级别的死锁。S锁除了可以与S锁兼容以外也可以和IS锁兼容。
锁的算法
锁的算法分为三种:Record锁、Gap锁、Next-Key锁。
- Record锁:记录锁,即对单个记录上进行加锁。
- Gap锁:间隙锁,对记录与记录之间的间隙进行加锁,但是不锁定记录。
- Next-Key锁:即锁定一个范围,也锁定记录。
MVCC
多版本控制(Multi Version Concurrency Control),将每一条写操作都记录到undo log中,方便事务读取历史版本的数据。这样的话只有写和写之间才会互不兼容,提升了并发效率。
当前读 & 快照读
数据库不同的写事务执行完成后会生成不同的快照,而快照读就是基于这些快照去读取,而并非是数据库记录的实际数值。
当前读就是每次都获取数据库的最新实际值。不考虑快照。
Undo log
在MVCC中,数据库为每一张表都额外添加了几个隐藏字段:
-
DB_ROW_ID
:数据记录的唯一标识,随着数据的插入而递增。可以简单的把它理解为功能类似主键ID。假如创建的表没有添加主键,则数据库会用该字段创建聚簇索引。 -
DB_TRX_ID
:最新写操作修改该记录的事务ID。也就是说哪个写事务最后提交,这字段就更新成这个事务的ID。 -
DB_ROLL_PTR
:回滚指针,指向undo log。
undo log是存放数据记录历史版本的地方。每次insert/update/delete操作都会生成对应的undo log。不同的是insert的undo log会在当前事务提交后就可以被清除掉。而update的会一直存在,除非记录被delete。delete的undo log会在当前没有快照在使用的时候允许被清除。
所以一张数据库表的结构如下:
由上图可以看到一条数据库真实数据记录是有一个指针指向undo log,然后整体是一个链表结构。也就是说历史版本都可以追溯到。
Read View
read view主要是来辅助事务进行可见性判断的。作用是判断当前事务可以看到哪些快照。内部重要的参数如下:
-
low_limit_no
:不需要undo log的事务编号,也就是说所有小于改编号的事务对应的undo log都可以被清除。 -
low_limit_id
:不应该看到undo log的最小事务ID,也就是说小于该ID的事务undo log均可见。初始化时为当前还未分配的最小事务ID。 -
up_limit_id
:所有小于该ID的事务undo log均可见。初始化的时候为trx_ids
中最小事务ID,如果trx_ids不存在,则up_limit_id
=low_limit_id
。 -
trx_ids
:当前read view创建的时候,其它处于未提交状态的事务ID列表,这些事务产生的undo log对当前事务是不可见的。 -
creator_trx_id
:当前事务ID。
struct read_view_t{
ulint type; /*!< VIEW_NORMAL, VIEW_HIGH_GRANULARITY */
undo_no_t undo_no;/*!< 0 or if type is
VIEW_HIGH_GRANULARITY
transaction undo_no when this high-granularity
consistent read view was created */
trx_id_t low_limit_no;
/*!< The view does not need to see the undo
logs for transactions whose transaction number
is strictly smaller (<) than this value: they
can be removed in purge if not needed by other
views */
trx_id_t low_limit_id;
/*!< The read should not see any transaction
with trx id >= this value. In other words,
this is the "high water mark". */
trx_id_t up_limit_id;
/*!< The read should see all trx ids which
are strictly smaller (<) than this value.
In other words,
this is the "low water mark". */
ulint n_trx_ids;
/*!< Number of cells in the trx_ids array */
trx_id_t* trx_ids;/*!< Additional trx ids which the read should
not see: typically, these are the read-write
active transactions at the time when the read
is serialized, except the reading transaction
itself; the trx ids in this array are in a
descending order. These trx_ids should be
between the "low" and "high" water marks,
that is, up_limit_id and low_limit_id. */
trx_id_t creator_trx_id;
/*!< trx id of creating transaction, or
0 used in purge */
UT_LIST_NODE_T(read_view_t) view_list;
/*!< List of read views in trx_sys */
};
整体read view的算法可以参考mysql源码,这里就不详细介绍了。
数据库的隔离级别
上面简单介绍了一下锁和MVCC机制,下面我们根据不同的数据库隔离级别来分析下文章开头的那个问题。为了举例说明,这边简单创建一张表初始化内容如下:
CREATE TABLE `test_lock` (
`id` int(11) NOT NULL AUTO_INCREMENT, // 主键
`age` int(11) NOT NULL, // 二级索引,允许重复
`name` varchar(50) NOT NULL, // 无索引
PRIMARY KEY (`id`),
KEY `idxAge` (`age`)
) ENGINE=InnoDB;
insert into test_lock(id, age, name) values(1, 20, 'A');
insert into test_lock(id, age, name) values(2, 20, 'B');
insert into test_lock(id, age, name) values(3, 18, 'C');
insert into test_lock(id, age, name) values(4, 22, 'A');
insert into test_lock(id, age, name) values(5, 17, 'B');
读未提交 - READ UNCOMMITTED
数据库最低隔离级别,顾名思义当前事务可以读取到其它事务未提交的更改数据。
在这个当前隔离级别下数据库不会采用快照读,所有的读操作都是直接读取最新的数据记录。
条件是主键
为了方便演示把问题的SQL改写成 delete from test_lock where id = 1
,下同
可以看出当执行一条写操作的时候,会锁住主键索引的一条记录(X锁)。
条件是普通索引非唯一索引
为了方便演示把问题的SQL改写成 delete from test_lock where age = 20
,下同
可以看到由于是普通索引,所以会先给查询到的符合条件的辅助索引记录上X锁,然后根据辅助索引找到对应的主键索引,再给主键索引符合条件的记录加上X锁。
条件无索引
为了方便演示把问题的SQL改写成 delete from test_lock where name = 'A'
,下同
遇到这种情况数据库会把全表索引记录加锁,可以看到这样开销是很大的。但是mysql对这种操作进行了优化,先锁住全表,再过滤出符合条件的记录,将不符合条件的记录提前释放掉X锁。只保留符合条件的记录锁。
读已提交 - READ COMMITTED
当前事务不可读取到其它事务未提交的数据。也就是说假如当前有事务T1
正在修改数据A
,然后再有一个事务T2
读取A
则只能读取到A
被修改以前的数据。但是如果事务T1
提交后,则T2
再次读取就可以读到T1
提交后的数据了。
对于此种数据库隔离级别,数据库加锁方式是跟RU是一模一样的。那么怎么区分RU和RC呢,它们最大的区别就是RU读取的是最新记录,而RC采用的就是快照读。也就是说RC采用了MVCC技术。
可重复读 - REPEATABLE READ
当前事务不论执行多少次读取操作,读取的结果都是一致的。举例说明:假如事务T1
读取数据A,然后再有一个事务T2
删除A
,这时候T1
再次读取还是可以读取到A
的。
条件是主键
同RC
条件是普通索引非唯一索引
可以看到加锁情况和RC是差不多的。但是多了一些Gap锁。在前面提到Gap和Recod锁结合叫Next-Key锁。这时数据库不仅仅把辅助索引的记录上X锁,而且还会在符合条件的两侧之间加上Gap锁。这样做的目的是为了解决幻读问题。那么是不是说RR这个隔离级别就解决了幻读呢?其实并不是,实际上RR在读操作上是解决了幻读问题,但是对于写操作还是不能解决幻读。
举个例子:
T1 | T2 |
---|---|
begin; | - |
select * from test_lock; | - |
- | begin; |
- | insert into test_lock(age, name) values(25, 'F'); |
- | commit; |
update test_lock set name = 'X'; | - |
commit; | - |
假如说T1这时候查询出来5条数据,然后再执行update的时候发现实际影响的行数为6。这样就导致了幻读情况。对于幻读可以采用SERIALIZABLE
来彻底解决。
条件无索引
可以看到数据库给所有的记录都加上X锁和所有的记录中间都有Gap锁。同时Mysql内部也做了优化过滤出符合条件的记录范围后会提前释放X锁和Gap锁。
可以得出结论RR和RC级别下数据库采用MVCC技术来实现快照读,两者的区别是:在一个事务中RC是每次读操作都会开启一个新的Read view。而RR则是在一个事务中只有第一次读操作才会开启一个新的Read view。
串行化 - SERIALIZABLE
在这个隔离级别下类似RR,唯一的不同就是:所有的读操作都会隐式加上lock in share mode
。即所有的写操作都加上S锁。这样再根据我们上面的数据库锁的兼容性表,可以知道在上面幻读的例子里T2执行insert操作的时候其实是要等待T1去释放S锁之后才可以操作。这样就解决了幻读。对于文章开头的问题:可以看出串行化对于写操作其实和RR是一样的,数据库加锁方式同RR一样。
参考
MySQL版本是基于5.6.24。