Python
中的线程是操作系统的原生线程,Python
虚拟机内部使用一个全局解释器锁(Global Interpreter Lock
,GIL
)来互斥线程对Python
虚拟机的使用。
0x01 GIL与线程调度
为了支持多线程,一个基本的要求就是需要实现不同线程对共享资源访问的互斥,这正是引入
GIL
的根本原因。
Python
中的GIL
是一个非常霸道的互斥实现:在一个线程拥有了解释器(获得了GIL
)的访问权限后,其他所有的线程都必须等待它释放解释器的访问权限,即使这些线程的下一条指令并不会互相影响。
初看上去,感觉这样的机制粒度太大了。我们似乎只需要将可能被多个线程访问的资源保护起来即可,对于不会被多个线程访问的资源,完全可以不用保护。
在
Python
发展历史中,这样的方案出现过,但是经过测试证实,效率没有GIL
好。
GIL
的机制,导致多处理器的情形退化为单处理器(多处理器可以同时执行多个线程),性能大打折扣。
对于线程调度机制而言,同操作系统的进程调度一样,最关键的是要解决两个问题:
- 在何时挂起当前线程,选择处于等待状态的下一个线程?
- 在众多处于等待状态的线程中,选择激活哪一个线程?
何时进行线程调度呢?
这个是由
Python
自身决定的。操作系统是怎样进行进程的切换的:当一个进程执行了一段时间后,发生了时钟中断,操作系统响应时钟中断,并在这时开始进行进程的调度。同样,
Python
也是通过软件模拟了时钟中断,来激活线程的调度。
Python
字节码解释器的工作原理是按照指令的顺序一条一条的顺序执行,Python
内部维护着一个数值N
(这个数值N就是Python
内部的时钟),意味着Python
在执行了N
条指令以后应该立即启动线程调度机制。可以通过
sys.getcheckinterval()
来获取这个值,也可以通过sys.setcheckinterval()
来更改这个值。在
Python
内部也使用这个值来检查是否有异步的事件(event
)发生,需要处理。
选择哪个等待线程来执行?
不知道。
这个选择机制
Python
交给了底层操作系统来解决。也就是说,
Python
借助了底层操作系统所提供的线程调度机制来选择下一个使用Python
解释器的线程是哪一个。
上面的解释就意味着,Python
中的线程实际上就是操作系统所支持的原生线程,而不是模拟出来的。
Python
的多线程机制正是建立在操作系统的原生线程的基础之上,对应不同的操作系统有不同的实现。然而最终,在各不相同的原生线程的基础之上,Python
提供了一套统一的抽象机制,给Python
的使用者一个简单方便的多线程工具箱(thread
、threading
)。