Python GIL全局解释器锁

首先来看一个例子，

def count_down(n):
    while n > 0:
        n -= 1

假设我们取n=100000000，首先采用单线程情况下执行这个函数count_down。

这时，我们想要采用多线程进行加速，来看如下的代码:

from threading import Thread

n = 100000000

t1 = Thread(target=count_down, args=[n // 2])
t2 = Thread(target=count_down, args=[n // 2])
t1.start()
t2.start()
t1.join()
t2.join()

这段代码在colab中是不太好输出运行时间的，但是从直观上来看，速度明没有变快，似乎变的更慢了。

不要怀疑是自己电脑坏了，不用去维修的，这不是电脑的问题，而是Python的线程失效了，并没有起到并行计算的作用，这就引出了今天的主角GIL(全局解释器锁)。

为什么有GIL

GIL，是最流行的 Python 解释器 CPython 中的一个技术术语。它的意思是全局解释器锁，本质上是类似操作系统的 Mutex。每一个 Python 线程，在 CPython 解释器中执行时，都会先锁住自己的线程，阻止别的线程执行。

当然，Cpython也会做一些trick，轮流执行Python线程，这样一来，从用户层面上看，Python的线程是在交错执行，来模拟真正的并行线程。

那么问题来了，为什么CPython要设计一个GIL呢？这实际上和CPython的实现是密切相关的，首先来简单看一下Python的内存管理机制。

CPython采用引用计数来管理内存，所有Python脚本中创建的实例，都会有一个引用计数，来记录多少指针指向他，当引用计数为0的时候，会自动释放内存，这么说可能非常抽象，我们来看一个栗子。

import sys
a = []
b = a
sys.getrefcount(a)

这里a的引用计数为3，因为存在a, b和作为参数的a的引用传递三处都引用了一个空列表。这样一来，如果两个Python线程同时引用了a，就会造成引用计数的race condition，引用计数可能最终只增加1，这样就会造成内存被污染，因为当第一个线程结束的时候，引用计数减一，达到条件内存释放，当第二个线程在试图访问a的时候，由于垃圾回收机制，内存已经被释放了，就无法访问到了，因此CPython引入GIL原因分为如下两点:

设计者为了规避类似于内存管理这样的复杂的竞争风险问题（race condition)
CPython 大量使用 C 语言库，但大部分 C 语言库都不是原生线程安全的

GIL是如何工作的？

在上图中，三个线程轮流执行，每一个线程执行开始，都会锁住GIL，用来阻止其他线程的执行，同样的每一个线程结束之后，都会释放GIL，允许其他线程开始使用资源。

那么，问题来了，如果我这个线程特别的牛，牢牢的抓住GIL不释放，呢么别的线程是不是就没有机会执行了呢?

没错，但是CPython还有另外一个机制，被称为check_interval，就是说，CPython回去轮训check线程GIL锁住的情况，每隔一段时间，Python解释器就会强制当前线程释放GIL，这样别的线程才能有执行的机会。

当然，不同版本的Python的check_interval实现机制是不同的，时间间隔也不同，不过这不影响我们做程序设计，我们只需要明白，CPython解释器会在合理的时间释放GIL就可以了。

Python线程安全

不过，有了 GIL，并不意味着我们 Python 编程者就不用去考虑线程安全了。即使我们知道，GIL 仅允许一个 Python 线程执行，但前面我也讲到了，Python 还有 check interval 这样的抢占机制。我们来考虑这样一段代码：

import threading

n = 0

def foo():
    global n
    n += 1

threads = []
for i in range(100):
    t = threading.Thread(target=foo)
    threads.append(t)

for t in threads:
    t.start()

for t in threads:
    t.join()

print(n)

这里，大多数情况是会打印100的，但是有概率打印99或者98，原因在于Python的foo操作是非原子性的，他被翻译成为4个字节码执行。

因此，执行这4个字节码的时候，是有可能被中断的，所以，作为程序开发者来说，你还是too youny to simple了，你仍然需要去考虑线程安全的问题，线程安全的代码如下所示。

n = 0
lock = threading.Lock()

def foo():
    global n
    with lock:
        n += 1

如何绕过GIL?

看到这里，会有读者发问了，有了GIL锁，Python的多线程岂不是非常鸡肋，如果你的代码不需要CPython来执行，那么你就不受GIL的限制。

实际上，对于高性能并行计算需求的库，已经对于这个进行了优化，比如numpy从c层面搞的代码，就不受这个锁的限制。

不过，大多数情况，不需要考虑GIL，如果多线程计算成为瓶颈，大多数库都已经解决了这个问题。如果你的程序真的有严格的性能要求，你还要使用Python的话，建议从c层面直接写代码，类似numpy的做法，啰里啰嗦了这么多，总结为如下两点:

绕过 CPython，使用 JPython（Java 实现的 Python 解释器）等别的实现
把关键性能代码，放到别的语言（C/C++）中实现

Python GIL全局解释器锁

为什么有GIL

GIL是如何工作的？

Python线程安全

如何绕过GIL?

推荐阅读更多精彩内容