进程
每个独立执行的程序成为进程
进程是程序的一次动态执行过程,它经历了从代码加载、执行到执行完毕的一个完整过程,这个过程也是进程本身从产生、发展到最终消亡的一个过程。
多进程(多任务)操作系统能同时运行多个(程序),由于CPU具有备份时机制,所以每个进程都能获得自己CPU时间片,由于CPU执行速度非常快,使得所有程序好像在“同时”运行一样。
在操作系统中进程是进行系统资源分配、调度和管理的最小单位,进程在执行过程中拥有更独立的内存单元。
比如:Windows采用进程作为最小隔离单位,每个进程都有自己的数据段、代码段,并且与别人的进程没有任何关系,因此进程间进行信息交互比较麻烦
进程也可以通过派生(fork或者spawn)新的进程来执行其他任务,不过因为每个新进程也都拥有自己的内存和数据栈等,所以只能采用进程间通信(IPC)的方式共享信息
线程
为了解决进程调度资源的浪费,为了能够共享资源,出现了线程,有时候把线程称之为轻量级进程。
线程是CPU调度和分派的基本单位,他可与同属一个进程的其他线程共享进程所拥有的全部资源,多个线程共享内存,从而极大的提高了程序的运行效率。
线程是比进程更小的执行单位,线程是进程内部单一的一个顺序控制流。
所谓多线程是指一个进程在执行过程中可以产生多个线程,这些线程可以同时存在,同时运行,形成多条执行线索,一个进程可能包含了多个同时执行的线程。
一个或更多的线程构成一个进程(操作系统是一进程为单位的,而进程是一线程为单位的,进程中必须有一个主线程main)
如果一个进程没有了,那么这个进程内的所有线程肯定会消失,如果线程消失了,但是进程未必会消失,只有所有的线程都结束了,今后才能才会结束,而且所有的线程都是在进程的基础之上同时运行的。
在大多数系统上,python支持多进程(基于消息传递)编程和多线程编程,大多人比较熟悉的事多线程编程,但是在python中的多线程编程却是有诸多的限制。
python中的多线程的限制
为了线程安全考虑,python的解释器还是使用了内部的GIL(Global Interperter Lock,全局解释器锁定),在任意时刻只能运行单个python的线程执行。
即使有多个可用的cpu核心,也是如此,这就限制了python只能在一个cpu核心上运行。
GIL的存在直接影响了程序的并发编程问题
如果一个应用程序是大部分与I/O相关,那么使用线程一般没问题,因为大部分时间都是在I/O等待
如果一个应用程序是CPU密集型的,则使用多线程坏处大于好处,返回会降低程序的运行速度,一般比你想象的还要慢得多
因此,用户在有些情况需要使用多进程(多进程和消息传递)