进程与线程是现代计算机系统的重要概念,下面摘录两者的定义:
进程:是执行中一段程序,即一旦程序被载入到内存中并准备执行,它就是一个进程。进程是表示资源分配的的基本概念,又是调度运行的基本单位,是系统中的并发执行的单位。
线程:单个进程中执行中每个任务就是一个线程。线程是进程中执行运算的最小单位。
对于两个的定义相比大家已经耳熟能详,然而能讲出两个两者的定义,就真的已经深入理解了进程(线程)是如何工作的吗?本文从硬件、操作系统两个角度来深入理解一下进程(线程),进程(线程)究竟是什么东西?他们究竟是怎么被操作系统调度的,需要哪些软硬件的协同工作?
CPU顺序运行
为了能够理解线程,我们先来看看程序是如何在CPU上执行的。CPU内部主要包含三个部分:
- 控制单元(Control Unit),主要给指令译码,并发出执行指令的操作。比如指令是一条加法,那么控制器发送指令给ALU完成加法操作,如果是一条load指令,那么会发送信号给DMP(data memory pipeline)模块将memory中的数据load到CPU中寄存器。
- 算数逻辑单元(ALU),负责计算类指令执行,比如两个数相加、相减等。
- 寄存器组,比如PC寄存器,PC寄存器存储当前CPU执行指令的地址,CPU处理完当前指令后PC值指向下一条指令,地址加4。其他寄存器也有一些特别的作用,不再赘述。
按照冯诺依曼架构系统设计,程序应该按照一定的顺序串行执行。CPU就是通过PC指针不断累加,实现程序的串行执行。正常情况下PC指针的值每个cycle会自动加4,由于每个指令占4个字节,那么CPU在执行完当前指令后,就会自动执行下一个指令。
打破CPU顺序运行
正常情况下从给系统加电, PC就不断累加,CPU按照串行顺序一致执行下去。有两个情况PC的值会发生“突变”:
- 程序主动跳转,比如汇编goto指令,c语言的longjmp函数等。本质上就是主动去修改PC的值,直接跳转到需要执行的指令,而不是位置临近的“下一条指令”。
-
系统发生中断,比如CPU的某一条引脚的电瓶为高表示发生了“突变”,系统比如对这个中断做出反应。中断发出者除了发送高电平到CPU相关引脚,还需要提供一个中断向量号,通知CPU发生了什么类型的中断。CPU根据中断向量号,找到相应的中断处理程序并处理中断。
CPU多线程执行
既然CPU默认是按照程序串行执行,那么怎么去实现多线程并发执行呢?核心思想是:只要保存下当前程序执行现场,包括PC值、各寄存器值,那么不管CPU现在执行其他什么程序,都能恢复到上次程序执行的现场,并按照之前的执行顺序继续执行,就当什么事情也没有发送过一样。
需要做到单核CPU并发,需要涉及到几点:
- 线程执行状态的保存,简单理解就是CPU中各寄存器值的保存,比如保存PC值我们可以知道这个线程执行到哪个指令了
- 多线程之间的切换,保存下当前线程的状态,恢复之前暂停的线程的状态并继续执行
- 需要有一个调度者决定恢复执行哪个线程,可以根据线程的优先级,也可以随机选择,不同操作系统实现算法不一
我们可以定义个数组pTable,把每个线程的执行状态存在里面,就有办法从保存的信息中恢复上次执行的状态,并继续串行执行。说白了,线程也是一个对象结构,里面包含的就是这个线程的唯一标示、当前线程的执行状态等内容。线程间的切换,就是线程上下文的保存与恢复。保存下当前线程的状态,恢复之前暂停的线程的状态并继续执行。调度程序负责恢复执行哪个线程,并一直循环下去。
那么问题来了,加入当前CPU已经在执行某一个线程,如何能够定期切换到调度程序scheduler呢?这时候就需要硬件的支持了,通过硬件的定时器与中断功能,需要实现一个定时中断程序。比如每隔1ms触发一个硬件中断,强迫CPU回到调度程序中去。中断的本质,就是打破PC寄存器累加的节奏,直接让CPU去处理中断相应程序,而不是一直按照既定顺序一致串行执行下去。
我们可以在中断处理程序中,让当前线程主动让出(yeild)CPU控制权,让CPU恢复执行scheduler调度程序。当然当前线程让出CPU控制权,也是一个上下文切换,需要保存当前线程执行状态,并回复scheduler线程状态。从这个角度上讲,操作系统的调度程序其实就是一个普通的线程罢了。当然实现调度程序定时切换的方式有很多中,这里为了便于理解,采用了一种比较简单的方案。