一、排查死锁原因以及快速终止当前死锁
首先打开MySQL终端或在Navicat里打开查询
快速停止死锁:如果影响程序的运行,可以使用kill trx_mysql_thread_id(事务的线程id)先手动结束死锁,但是停止后再排查比较麻烦
1、查看连接信息、锁数量
-- 查看长时间执行的sql (可以简单看一下,如果有super权限,可以看到全部的连接的线程,显示连接的ip、state(当前连接的sql语句的状态)、正在执行的语句等,主要关注state)
show processlist;
--表锁数量、等待时间
show status like 'table%';
--行锁数量、等待时间
show status like 'InnoDB_row_lock%';
2、查看当前运行的所有事务以及状态等信息(重点)
select * from information_schema.INNODB_TRX;
在这个表中主要看
trx_id 事务id
trx_state 事务的运行状态
trx_started 事务的开始时间
trx_mysql_thread_id 线程id
trx_query 正在执行的sql
trx_tables_locked 事务锁定的表
trx_rows_locked 事务锁定的行
trx_isolation_level 事务的隔离级别
3、查看事务中的锁信息(重点)
select * from `performance_schema`.data_locks;
在这个表中主要看
ENGINE 数据库使用的引擎
ENGINE_LOCK_ID 锁的id
ENGINE_TRANSACTION_ID 属与哪个事务(这里对应的是上一步查询到的trx_id事务id)
THREAD_ID 线程id
OBJECT_SCHEMA 锁定数据库的名称
OBJECT_NAME 锁定表的名称
INDEX_NAME 锁定的索引
LOCK_TYPE 锁类型(TABLE表锁、RECORD行锁)
LOCK_MODE 锁模式(S读锁、X写锁、IS意向共享锁、IX意向排它锁,mysql会在操作表前先为表添加意向锁)
LOCK_STATUS 锁状态(GRANTED锁已经被授予并被持有、WAITING锁正在等待被授予)
LOCK_DATA 锁定的值,行锁的时候会展示锁定的值
4、查询锁等待时间(重点)
select * from `performance_schema`.data_lock_waits;
在这个表中主要看
ENGINE:请求的锁的引擎
REQUESTING_ENGINE_LOCK_ID:请求的锁在存储引擎中的锁ID
REQUESTING_ENGINE_TRANSACTION_ID:请求锁的事务对应的事务ID
REQUESTING_THREAD_ID:请求锁的线程id
REQUESTING_EVENT_ID:请求锁的EVENT id
REQUESTING_OBJECT_INSTANCE_BEGIN:请求的锁的内存地址
BLOCKING_ENGINE_LOCK_ID:阻塞的锁的ID,对应data_locks表的ENGINE_LOCK_ID
BLOCKING_ENGINE_TRANSACTION_ID:锁阻塞的事务ID
BLOCKING_THREAD_ID:锁阻塞的线程id
BLOCKING_EVENT_ID:锁阻塞的EVENT id
BLOCKING_OBJECT_INSTANCE_BEGIN:阻塞的锁内存地址
通过以上查询,很快就可以排查出死锁的关系,但是对应的sql是看不到的。
二、查询死锁的其他信息
1、执行以下命令查看InnoDB存储引擎的状态信息,在Status字段中 查找"LATEST DETECTED DEADLOCK"部分,其中会列出最近检测到的死锁信息以及执行的事务和sql
show engine innodb status;
2、通过查看慢sql来排查,
--查看slow_query_log是否开启和日志路径
SHOW VARIABLES LIKE '%query%';
--如果是关闭状态可以使用以下命令开启
SET global slow_query_log='ON';
通过以上方案可快速排查死锁原因,另外要仔细检查程序。
三、一些引发死锁的原因
1、如果多个事务同时尝试更新相同的行或页面,可能会导致死锁或锁定表
1、spring的@Transactional注解和synchronized一起使用有可能造成死锁,因为Transactional是通过aop实现的
2、仔细排查程序逻辑,避免嵌套锁、及时释放锁、保持锁的顺序一致、尽量减少长事务
这是我自己排查线上死锁时的记录,一般通过以上方法都可以查找到死锁的原因,有不足的地方还望大家指点