首先来看一个例子,
def count_down(n):
while n > 0:
n -= 1
假设我们取n=100000000
,首先采用单线程情况下执行这个函数count_down
。
这时,我们想要采用多线程进行加速,来看如下的代码:
from threading import Thread
n = 100000000
t1 = Thread(target=count_down, args=[n // 2])
t2 = Thread(target=count_down, args=[n // 2])
t1.start()
t2.start()
t1.join()
t2.join()
这段代码在colab中是不太好输出运行时间的,但是从直观上来看,速度明没有变快,似乎变的更慢了。
不要怀疑是自己电脑坏了,不用去维修的,这不是电脑的问题,而是Python的线程失效了,并没有起到并行计算的作用,这就引出了今天的主角GIL(全局解释器锁)。
为什么有GIL
GIL,是最流行的 Python 解释器 CPython 中的一个技术术语。它的意思是全局解释器锁,本质上是类似操作系统的 Mutex。每一个 Python 线程,在 CPython 解释器中执行时,都会先锁住自己的线程,阻止别的线程执行。
当然,Cpython也会做一些trick,轮流执行Python线程,这样一来,从用户层面上看,Python的线程是在交错执行,来模拟真正的并行线程。
那么问题来了,为什么CPython要设计一个GIL呢?这实际上和CPython的实现是密切相关的,首先来简单看一下Python的内存管理机制。
CPython采用引用计数来管理内存,所有Python脚本中创建的实例,都会有一个引用计数,来记录多少指针指向他,当引用计数为0的时候,会自动释放内存,这么说可能非常抽象,我们来看一个栗子。
import sys
a = []
b = a
sys.getrefcount(a)
这里a的引用计数为3,因为存在a, b和作为参数的a的引用传递三处都引用了一个空列表。这样一来,如果两个Python线程同时引用了a,就会造成引用计数的race condition
,引用计数可能最终只增加1,这样就会造成内存被污染,因为当第一个线程结束的时候,引用计数减一,达到条件内存释放,当第二个线程在试图访问a的时候,由于垃圾回收机制,内存已经被释放了,就无法访问到了,因此CPython引入GIL原因分为如下两点:
- 设计者为了规避类似于内存管理这样的复杂的竞争风险问题(race condition)
- CPython 大量使用 C 语言库,但大部分 C 语言库都不是原生线程安全的
GIL是如何工作的?
在上图中,三个线程轮流执行,每一个线程执行开始,都会锁住GIL,用来阻止其他线程的执行,同样的每一个线程结束之后,都会释放GIL,允许其他线程开始使用资源。
那么,问题来了,如果我这个线程特别的牛,牢牢的抓住GIL不释放,呢么别的线程是不是就没有机会执行了呢?
没错,但是CPython还有另外一个机制,被称为check_interval
,就是说,CPython回去轮训check线程GIL锁住的情况,每隔一段时间,Python解释器就会强制当前线程释放GIL,这样别的线程才能有执行的机会。
当然,不同版本的Python的check_interval
实现机制是不同的,时间间隔也不同,不过这不影响我们做程序设计,我们只需要明白,CPython解释器会在合理的时间释放GIL就可以了。
Python线程安全
不过,有了 GIL,并不意味着我们 Python 编程者就不用去考虑线程安全了。即使我们知道,GIL 仅允许一个 Python 线程执行,但前面我也讲到了,Python 还有 check interval 这样的抢占机制。我们来考虑这样一段代码:
import threading
n = 0
def foo():
global n
n += 1
threads = []
for i in range(100):
t = threading.Thread(target=foo)
threads.append(t)
for t in threads:
t.start()
for t in threads:
t.join()
print(n)
这里,大多数情况是会打印100的,但是有概率打印99或者98,原因在于Python的foo操作是非原子性的,他被翻译成为4个字节码执行。
因此,执行这4个字节码的时候,是有可能被中断的,所以,作为程序开发者来说,你还是too youny to simple了,你仍然需要去考虑线程安全的问题,线程安全的代码如下所示。
n = 0
lock = threading.Lock()
def foo():
global n
with lock:
n += 1
如何绕过GIL?
看到这里,会有读者发问了,有了GIL锁,Python的多线程岂不是非常鸡肋,如果你的代码不需要CPython来执行,那么你就不受GIL的限制。
实际上,对于高性能并行计算需求的库,已经对于这个进行了优化,比如numpy从c层面搞的代码,就不受这个锁的限制。
不过,大多数情况,不需要考虑GIL,如果多线程计算成为瓶颈,大多数库都已经解决了这个问题。如果你的程序真的有严格的性能要求,你还要使用Python的话,建议从c层面直接写代码,类似numpy的做法,啰里啰嗦了这么多,总结为如下两点:
- 绕过 CPython,使用 JPython(Java 实现的 Python 解释器)等别的实现
- 把关键性能代码,放到别的语言(C/C++)中实现