死锁是一种无限的互相等待的状态,两个或两个以上的线程或进程构成一个互相等待的环状。以两个线程为例,线程一持有A锁同时在等待B锁,而线程二持有B锁同时在等待A锁,这就导致两个线程互相等待无法往下执行。现实生活中一个经典的死锁情形就是四辆汽车通过没有红绿灯的十字路口,假如四辆车同时到达中心的,那么它们将形成一个死锁状态。每辆车拥有自己车道上的使用权,但同时也在等另外一辆汽车让出另外一条道的使用权
死锁的例子
该例子中一共有lock1和lock2两个锁。线程一启动后先尝试获取lock1锁,成功获取lock1后再继续尝试获取lock2锁。而线程二则是先尝试获取lock2锁,成功获取lock2锁后再继续尝试获取lock1锁。当我们某次启动程序后可能的输出情况如下,也就进入了死锁状态,但并非每次都一定会进入死锁状态,每个线程睡眠100毫秒是为了增加死锁的可能。最终两个线程处于互相无线等待状态,获得lock1的线程一在等lock2,而获得lock2的锁却在等lock1。
死锁的处理
由于死锁的检测涉及到很多复杂的场景,而且它还是运行时才会产生的,所以编程语言编译器一般也不会提供死锁的检测功能,包括Java也不提供死锁检测功能。这其实就叫做鸵鸟算法,对于某件事如果我们没有很好的处理方法,那么就学鸵鸟一样把头埋入沙中假装什么都看不见。死锁的场景处理就交给了实际编程的开发者,开发者需要自己去避免死锁的发生,或者制定某些措施去处理死锁发生时的场景。常见的死锁处理方式大致分为两类:一种是事前的预防措施,包括锁的顺序化、资源合并、避免锁嵌套等等。另一种是事后的处理措施,包括锁超时机制、抢占资源机制、撤销线程等等。下面我们详细看看每种措施的情况。
锁的顺序变化
前面说到的死锁形成的条件中环形条件,我们可以破坏这个条件来避免死锁的发生。具体就是将锁的获取进行顺序化,所有线程和进程对锁的获取都按指定的顺序进行,比如下图中P1、P2、P3三个线程它们都先尝试持有R1锁,再尝试持有R2锁,最后尝试持有R3锁。当然也可以看成是要获取R3锁就必须先获取R2锁,而要获取R2锁就必须先获取R1锁。这样就能破坏环形条件,从而避免死锁。
资源合并
资源合并的做法就是将多个资源合并当成一个资源来看待,这样就能将对多个资源的获取变成只对一个资源的获取,从而避免了死锁的发生。如下图,将资源R1、资源R2和资源R3合并成一个资源R,然后三个线程对其进行获取操作。
避免锁嵌套
锁获取操作的嵌套行为才可能导致死锁发生,所以我们可以通过去除锁嵌套来避免死锁。每个线程都是使用完某个资源就释放,然后才能再获取另外一个资源,而且使用完又进行释放,这就是去除锁嵌套。如下图中线程P1持有R1锁后释放,然后持有R2锁后释放,最后持有R3锁并释放,其它线程也是类似地操作。
锁的超时机制
事后处理的第一种措施是锁超时机制,核心就在于对锁的等待并非永久的而是有超时的,某个线程对某个锁的等待如果超过了指定的时间则做超时处理,直接结束掉该线程。比如下图中,三个线程已经进入死锁状态了,假如线程P1等待R2锁的时间超过了超时时间,此时P1将结束并且释放对R1锁的占有权。这时线程P3则能够获取到R1锁,于是能够解除等待,自此解除了死锁状态。
总结
本文主要介绍了死锁相关内容,除了介绍死锁概念外我们还提供了死锁的例子,还有死锁形成的条件,以及死锁的处理方式。死锁的处理主要包括锁的顺序化、资源合并、避免锁嵌套等事前预防措施和超时机制、抢占资源机制、撤销线程机制等事中的处理措施