python解释器
我们一直说python是解释性语言,不需要编译,并不是说操作系统真的就能识别.py文件的代码了,机器永远只能识别01010101,要想在机器上运行,编译的过程少不了,而python解释器的工作,就是将python代码转换成机器能识别的010101二进制指令。
python解释器是一个程序,常见的有:
- CPython:C语言开发,使用最广,默认的解释器
- IPython:基于CPython之上的交互式解释器
- PyPy:采用JIT技术,对python代码进行动态编译,追求执行速度
- Jython:运行在Java平台上的解释器,可以直接编译成Java字节码执行
- IronPython:同理Jython,运行在 .Net 平台上
GIL全局解释器锁
同进程内的多线程,一个线程运行会霸占python解释器,使其他线程无法运行,所以python的多线程其实并不是同时进行的。而多进程是由系统分配资源,等于每个进程都有一个python解释器,所以多进程可以同时进行,但是资源开销大。
GIL底层实现原理
上面这张图,就是 GIL 在 Python 程序的工作示例。其中,Thread 1、2、3 轮流执行,每一个线程在开始执行时,都会锁住 GIL,以阻止别的线程执行;同样的,每一个线程执行完一段后,会释放 GIL,以允许别的线程开始利用资源。
如果线程一直阻塞呢?是不是就一直锁住了?或者说线程是否就会完全执行完了?
答案是NO。
CPython 中还有另一个机制,叫做间隔式检查(check_interval),意思是 CPython 解释器会去轮询检查线程 GIL 的锁住情况,每隔一段时间,Python 解释器就会强制当前线程去释放 GIL,这样别的线程才能有执行的机会,这就是cpython为线程提供了并发能力。
但这个并发能力并不一定是我们想要的,因为我们的python代码可能需要保证原子性,如:给10000长度的列表sort,如果因为cpython的间隔式检查,在这个功能还没执行完的时候就将执行权切换给了另外一个线程,这显然不是我们想要的,显然就很不线程安全了,所以我们需要人为加锁
什么是线程安全?
因为同一进程内的线程之间是资源共享的
- 共享的好处是,可以不用频繁的加载资源,而资源加载是属于IO操作,是比较耗时的
- 共享的坏处是,多进程间可以随意修改资源,势必会因为数据混乱而导致业务出错
为了要保证多线程之间的资源一致性,所以Cpython解释器使用了GIL,来保证每次只有一个线程能执行,从一定程度上保证了线程安全。但并不绝对,在实际编码过程中,依然要人为加锁。