Python GIL全局解释器锁

首先来看一个例子,

def count_down(n):
    while n > 0:
        n -= 1

假设我们取n=100000000,首先采用单线程情况下执行这个函数count_down

这时,我们想要采用多线程进行加速,来看如下的代码:

from threading import Thread

n = 100000000

t1 = Thread(target=count_down, args=[n // 2])
t2 = Thread(target=count_down, args=[n // 2])
t1.start()
t2.start()
t1.join()
t2.join()

这段代码在colab中是不太好输出运行时间的,但是从直观上来看,速度明没有变快,似乎变的更慢了。

不要怀疑是自己电脑坏了,不用去维修的,这不是电脑的问题,而是Python的线程失效了,并没有起到并行计算的作用,这就引出了今天的主角GIL(全局解释器锁)。

为什么有GIL

GIL,是最流行的 Python 解释器 CPython 中的一个技术术语。它的意思是全局解释器锁,本质上是类似操作系统的 Mutex。每一个 Python 线程,在 CPython 解释器中执行时,都会先锁住自己的线程,阻止别的线程执行。

当然,Cpython也会做一些trick,轮流执行Python线程,这样一来,从用户层面上看,Python的线程是在交错执行,来模拟真正的并行线程。

那么问题来了,为什么CPython要设计一个GIL呢?这实际上和CPython的实现是密切相关的,首先来简单看一下Python的内存管理机制。

CPython采用引用计数来管理内存,所有Python脚本中创建的实例,都会有一个引用计数,来记录多少指针指向他,当引用计数为0的时候,会自动释放内存,这么说可能非常抽象,我们来看一个栗子。

import sys
a = []
b = a
sys.getrefcount(a)

这里a的引用计数为3,因为存在a, b和作为参数的a的引用传递三处都引用了一个空列表。这样一来,如果两个Python线程同时引用了a,就会造成引用计数的race condition,引用计数可能最终只增加1,这样就会造成内存被污染,因为当第一个线程结束的时候,引用计数减一,达到条件内存释放,当第二个线程在试图访问a的时候,由于垃圾回收机制,内存已经被释放了,就无法访问到了,因此CPython引入GIL原因分为如下两点:

  • 设计者为了规避类似于内存管理这样的复杂的竞争风险问题(race condition)
  • CPython 大量使用 C 语言库,但大部分 C 语言库都不是原生线程安全的

GIL是如何工作的?

在上图中,三个线程轮流执行,每一个线程执行开始,都会锁住GIL,用来阻止其他线程的执行,同样的每一个线程结束之后,都会释放GIL,允许其他线程开始使用资源。

那么,问题来了,如果我这个线程特别的牛,牢牢的抓住GIL不释放,呢么别的线程是不是就没有机会执行了呢?

没错,但是CPython还有另外一个机制,被称为check_interval,就是说,CPython回去轮训check线程GIL锁住的情况,每隔一段时间,Python解释器就会强制当前线程释放GIL,这样别的线程才能有执行的机会。

当然,不同版本的Python的check_interval实现机制是不同的,时间间隔也不同,不过这不影响我们做程序设计,我们只需要明白,CPython解释器会在合理的时间释放GIL就可以了。

Python线程安全

不过,有了 GIL,并不意味着我们 Python 编程者就不用去考虑线程安全了。即使我们知道,GIL 仅允许一个 Python 线程执行,但前面我也讲到了,Python 还有 check interval 这样的抢占机制。我们来考虑这样一段代码:

import threading

n = 0

def foo():
    global n
    n += 1

threads = []
for i in range(100):
    t = threading.Thread(target=foo)
    threads.append(t)

for t in threads:
    t.start()

for t in threads:
    t.join()

print(n)

这里,大多数情况是会打印100的,但是有概率打印99或者98,原因在于Python的foo操作是非原子性的,他被翻译成为4个字节码执行。

因此,执行这4个字节码的时候,是有可能被中断的,所以,作为程序开发者来说,你还是too youny to simple了,你仍然需要去考虑线程安全的问题,线程安全的代码如下所示。

n = 0
lock = threading.Lock()

def foo():
    global n
    with lock:
        n += 1

如何绕过GIL?

看到这里,会有读者发问了,有了GIL锁,Python的多线程岂不是非常鸡肋,如果你的代码不需要CPython来执行,那么你就不受GIL的限制。

实际上,对于高性能并行计算需求的库,已经对于这个进行了优化,比如numpy从c层面搞的代码,就不受这个锁的限制。

不过,大多数情况,不需要考虑GIL,如果多线程计算成为瓶颈,大多数库都已经解决了这个问题。如果你的程序真的有严格的性能要求,你还要使用Python的话,建议从c层面直接写代码,类似numpy的做法,啰里啰嗦了这么多,总结为如下两点:

  • 绕过 CPython,使用 JPython(Java 实现的 Python 解释器)等别的实现
  • 把关键性能代码,放到别的语言(C/C++)中实现
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容