线程(Thread)和进程(process)都是操作系统的基本概念,但是都很抽象,我们不容易想清楚,最近阅读了一些的文章,下面记录一下对其的理解。
一、基本概念(来自于wikipedia)
- 进程(process)
进程(英语:process),是指计算机中已运行的程序。进程曾经是分时系统的基本运作单位。在面
向进程设计的系统(如早期的UNIX,Linux 2.4及更早的版本)中,进程是程序的基本执行实体;在
面向线程设计的系统(如当代多数操作系统、Linux 2.6及更新的版本)中,进程本身不是基本运行
单位,而是线程的容器。程序本身只是指令、数据及其组织形式的描述,进程才是程序(那些指令和数
据)的真正运行实例。
- 线程
线程(英语:thread)是操作系统能够进行运算调度的最小单位。大部分情况下,它被包含在进程之
中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多
个线程,每条线程并行执行不同的任务。在Unix System V及SunOS中也被称为轻量进程
(lightweight processes),但轻量进程更多指内核线程(kernel thread),而把用户线程
(user thread)称为线程,且线程是独立调度和分配的基本单位。
从上述的描写中我们可以得到一个这样的结论,一个操作系统可以有多个进程,一个进程中可以有多个线程,也就是说进程其实是线程的容器。
- 线程和进程的一个比较表格:
S.no | Process | Thread |
---|---|---|
1、 | 进程是计算机正在运行的程序; | 线程是进程的一部分,是调度的基本单位; |
2、 | 需要更多的成本去创建,销毁,切换上下文,通信; | 需要更少的成本; |
3、 | 消耗更多的计算机资源; | 消耗更少的计算机资源 |
4、 | 进程间独立; | 线程间之间可以共享内存 |
5、 | 进程有自己独立的栈和地址空间; | 线程间有自己所属的进程管理块,从中获取栈和地址空间 |
但是还是很抽象,最近看了一篇文章,一个歪果人的博客用了一个比较生动的例子阐述了线程和进程之间的关系,觉得很有意思,这里借用他的例子和自己的一些理解解释一下。
原文🔗
二、比喻的修辞手法
-
进程比喻为一个房子,独幢小别墅,大体是下面的样子。
- 进程:
多进程就是我们所说的别墅区,房间占一块地基,那么进程就占一块计算机资源,就是一个container,房子里有很多的房间,包含了很多的功能,厨房,厕所,卧室等等,这个就是计算机分配给进程的资源,进程和进程之间了,就是一个别墅区的两栋小别墅,互相隔离,强行闯入是违法的,但是房子是一个被动的对象,他在那里什么也干不了,他只能被住,被使用;
- 线程:
既然进程是线程的容器,那房子里面的人就是线程,如果你单身就是单线程,如果你结婚生子就是多线程,这个房子的住户对于房子来说是从属关系,我买了这栋房子,我就有权利使用这个房子的功能,而且对于房子里的人是共享的,我们可以使用卫生间,卧室,阳台等,这些区域我们叫共享内存。
三、名词解释
1、上下文
我们经常听见上下文和上下文切换这一类的词语,我们怎么理解上下文这个概念呢?
我的理解上下文就是需要的环境,我们应该玩过此类的游戏,一个账号有很多个角色,一个法师是46级,一个战士是100级,如果你选择了法师,对应法师的装备坐骑和一些通关的信息就是这个角色的上下文,如果你玩了一会法师,突然想玩战士,你就需要切换到战士视角,这种切换就可以理解为上下文的切换吧,不知道这个比喻是否合适。
进程=运行中的程序=程序代码+代码所出的上下文,对应上面的比喻,这个角色就是程序代码,代码可以运行,你也可以操作这个游戏人物走动或者放出招式,而这个游戏角色的装备等级就是这个人物的上下文。
❓那进程和线程的上下文切换有什么区别?
进程:通过上面的比喻,我们如果需要切换角色,是整个游戏场景都要切换的,装备坐骑等级,这些都会发生一个本质的变化,虚拟空间也会变化,对比房子的比喻,我们换了一个房子,对于cpu的缓存机制也会干扰,角色都换了,那以后保存的那些信息是不是一瞬间就作废了。
线程:线程切换上下文就可以理解为同一个游戏角色,只是切换了一个游戏模式,比如刀战,我只需要带上刀具,魔法战我只需要带上魔杖,空间还是一样,房子还是同一个,这样的消耗会少的多。
四、线程和进程的详解
❓为什么会出现并发?
其实这就是我们压榨CPU的一种手段,那么我们就需要了解一下CPU是如何工作的,带着这个问题我查阅了一些资料,知道了一个叫PC(program Counter)的东西,这里粘贴一下wikipedia的介绍:
程序计数器(英语:Program Counter,PC)是一个中央处理器中的寄存器,用于指示计算机在其
程序序列中的位置。在大部分的处理器中,指令指针都是在提取程序指令后就被立即增加;也就是说
跳跃指令的目的地址,是由跳跃指令的操作数加上跳跃指令之后下一个指令的地址(单位为比特或字
节,视电脑形态而定)来获得目的地。
- CPU运行程序的步骤我就可以简单的理解为3步
1、pc指针指向一句代码,然后开始算;
2、算完以后,pc指针=当前指针+1(假设没有跳跃的方式)
3、执行下一段代码,pc指针在移动;
但是CPU可以一直不休息,一直算算算吗?答案是不行,因为有io操作,比如遇到一个打印语句,IO操作相比于cpu的计算操作是很慢慢的,就是一个是飞机一个是步行的对比吧,那cpu就需要等啊,等io操作完成以后,在进行下面的操作,但是我们要压榨cpu啊,那可以不可以让cpu在等待的期间,干其他的事呢,那就让cpu干其他程序的计算工作,让他没有休息的时间,交替的运行不同的程序,这就是并发。