python解释器
我们一直说python是解释性语言,不需要编译,并不是说操作系统真的就能识别.py文件的代码了,机器永远只能识别01010101,要想在机器上运行,编译的过程少不了,而python解释器的工作,就是将python代码转换成机器能识别的010101二进制指令。
python解释器是一个程序,常见的有:
- CPython:C语言开发,使用最广,默认的解释器
- IPython:基于CPython之上的交互式解释器
- PyPy:采用JIT技术,对python代码进行动态编译,追求执行速度
- Jython:运行在Java平台上的解释器,可以直接编译成Java字节码执行
- IronPython:同理Jython,运行在 .Net 平台上
GIL全局解释器锁
同进程内的多线程,一个线程运行会霸占python解释器,使其他线程无法运行,所以python的多线程其实并不是同时进行的。而多进程是由系统分配资源,等于每个进程都有一个python解释器,所以多进程可以同时进行,但是资源开销大。
GIL底层实现原理
上面这张图,就是 GIL 在 Python 程序的工作示例。其中,Thread 1、2、3 轮流执行,每一个线程在开始执行时,都会锁住 GIL,以阻止别的线程执行;同样的,每一个线程执行完一段后,会释放 GIL,以允许别的线程开始利用资源。
如果线程一直阻塞呢?是不是就一直锁住了?或者说线程是否就会完全执行完了?
答案是NO。
CPython 中还有另一个机制,叫做间隔式检查(check_interval),意思是 CPython 解释器会去轮询检查线程 GIL 的锁住情况,每隔一段时间,Python 解释器就会强制当前线程去释放 GIL,这样别的线程才能有执行的机会,这就是cpython为线程提供了并发能力。
但这个并发能力并不一定是我们想要的,因为我们的python代码可能需要保证原子性,如:给10000长度的列表sort,如果因为cpython的间隔式检查,在这个功能还没执行完的时候就将执行权切换给了另外一个线程,这显然不是我们想要的,显然就很不线程安全了,所以我们需要人为加锁
什么是线程安全?
因为同一进程内的线程之间是资源共享的
- 共享的好处是,可以不用频繁的加载资源,而资源加载是属于IO操作,是比较耗时的
- 共享的坏处是,多线程间可以随意修改资源,势必会因为数据混乱而导致业务出错
为了要保证多线程之间的资源一致性,所以Cpython解释器使用了GIL,来保证每次只有一个线程能执行,从一定程度上保证了线程安全。但并不绝对,在实际编码过程中,依然要人为加锁。
assert断言
assert 表达式
表达式为False,抛出异常
用于单元测试
闭包
内部函数对外部函数作用域里变量的引用。
函数内的变量,只能在函数运行的时候才能使用,而一旦离开该作用域,就无法取到。而闭包,使得即使外部函数执行完了,执行内部函数的时候依然可以调用外部函数的变量。因为内部函数保存了外部函数作用域里的变量(是真的保存了,而不是copy了值)。
类似于 面向对象,类似于在python文件里的函数引用了全局变量
装饰器
装饰器是用闭包实现的,那为啥装饰器要用两层函数实现,而不能用一层函数实现,如
def generator(func):
print("lalala")
return func
- 装饰器的作用,是在函数前后做一些额外的操作,而如果只用一层函数,无法在return func之后做额外的操作了
- 如果待装饰函数有参数,像这种单层装饰器就无法传递内部参数
- 其实装饰器只是一个使用闭包思想的场景,其并没有要求一层两层还是三层,要看具体场景
协程
WHAT
并不是计算机系统提供(进程,线程),而是程序员人为创造的。
用户态内的上下文切换技术。
简而言之,就是通过一个线程实现代码之间的相互切换
WHY
在一个线程中,如果遇到IO等待,利用该空闲时间,再去干点其他的事。