最近学习Python的进程和线程,发觉自己对于进程和线程的理解不是很清楚,所以有了这篇文章,目的是从浅入深的理解一下进程和线程。参考了两篇文章,详见最后。
从一个比喻来理解进程和线程
CPU就好比是一个工厂,它不断的执行各种任务。但是这个工厂的电力只允许一次执行一项任务。也就是说,单个CPU一次只能执行一个任务。
进程好比是工厂的车间,它表示CPU处理的单个任务,CPU总是运行一个进程,其他的进程处于等待状态。
一个车间中有多个工人协作,线程就好比是一个个工人。一个线程可以有多个线程。
车间的工人可以共享车间的空间。这象征这着线程可以共享内存空间。
不同的房间空间不同,有的允许多个工人进入,有的只允许一个工人进入。对应到线程上来看就是,线程可以共享内存空间,而有的特殊的内存空间只允许一个线程使用。其他的线程必须等到这个线程结束后才能使用这个内存空间。
那么如何实现线程独占上述的提到的特殊的内存空间呢?一种方法就是为进程加锁,这被称作互斥锁(Mutual exclusion,缩写 Mutex) 。这种方法就好像是一个人进入了房间把房间上了锁,后面的人就无法进入房间一样。
如果有些内存区域允许多个进程共享,但是允许的进程数存在上线,如何保证这种情况下线程有序的执行呢?类似上面的方法,只需要每个线程在使用内存时都上锁,那么其他的线程就无法占用了。这种做法被称作“信号量”(Semaphore)。可见,互斥锁是信号量的一种特例(线程数=1)。
总结
操作系统的设计,因此可以归结为三点:
(1)以多进程形式,允许多个任务同时运行;
(2)以多线程形式,允许单个任务分成不同的部分运行;
(3)提供协调机制,一方面防止进程之间和线程之间产生冲突,另一方面允许进程之间和线程之间共享资源。
从CPU的执行时间角度理解进程和线程
一言以蔽之:进程和线程是CPU执行时间段的描述,区别只是颗粒大小不同。
事实1:CPU的速度相比于其他设备(如内存,显卡,硬盘)来说非常快,在CPU看来,它是在轮流执行各项任务的。
事实2:执行一段程序代码的介绍。当程序代码获得CPU时,它所使用的其他资源必须已经到位(比如显卡,内存等),这里所说的其他资源被称作程序的上下文环境。这段程序代码完整的执行过程包括:获得上下文环境、执行代码、保存上下文环境,其中保存上下文环境是为了程序代码下次能够继续被CPU执行。
进程是什么?
说到这里进程的概念也就出现了,进程=CPU加载上下文的时间+CPU执行时间+CPU保存上下文的时间。
线程是什么?
线程实际上是对进程的进一步划分。一段程序代码一般包含了多个逻辑,比如说我打开一个QQ,向朋友发送消息(语音+视频)。这段程序代码包含发送语音和视频两个部分,它们就被称作线程。这里的两个线程共享了程序的上下文环境,是CPU执行时间的更小的划分。
总结
进程和线程是CPU执行时间段的描述,区别只是颗粒大小不同。
参考资料
[1] 《进程与线程的一个简单解释》 阮一峰 http://www.ruanyifeng.com/blog/2013/04/processes_and_threads.html
[2] 《线程和进程的区别是什么?》zhonyong的回答 https://www.zhihu.com/question/25532384