原语:完成某种特定功能的一段程序,具有不可分割性或不可中断性。原语的执行必须是连续的,在执行过程中不允许被中断(原子操作)
进程控制操作完成哥状态之间的转换,由具有特定功能的原语完成。(进程创建原语,进程撤销原语,阻塞原语,唤醒原语,挂起原语,激活原语,改变进程优先级...)
进程的创建
给新进程分配一个唯一标识以及进程控制块;为进程分配地址空间;初始化进程控制块;设置相应的队列指针,如把新进程加到就绪队列链表中。Unix:fork/exec Windows:CreateProcess
进程的撤销
收回进程所占有的资源(关闭打开的文件、断开网络连接、回收分配的内存);撤销该进程的PCB(意味着结束进程);Unix:exit Windows:TerminateProcess
进程的阻塞
处于运行状态的进程,在其运行过程中期待某一事件发生,如等待键盘输入、等待磁盘数据传输完成、等待其他进程发送消息,当被等待事件未发生时,由进程自己执行阻塞原语,使自己由运行态变为阻塞态。
Unix:wait Windows:WaitForSingleObject
Unix的几个进程控制操作
fork() 通过复制调用进程来建立新的进程,是最基本的进程建立过程
exec()包括一些列的系统调用,它们都是通过用一段新的程序代码覆盖原来的地址空间,实现进程执行代码的转换
wait()供初级进程同步操作,能使一个进程等待另外一个进程结束
exit()用来终止一个进程的运行
Unix示例:
为子进程分配一个空闲的进程描述符(proc结构);分配给子进程唯一标识pid;以一次一页的方式复制父进程地址空间;从父进程处继承共享资源,如打开的文件和当前工作目录等;将子进程的状态设为就绪,插入到就绪队列;对子进程返回标识符0;向父进程返回子进程的pid
COW(Copy-On-Write)Linux采用写时拷贝技术,只有进程空间的各段内容要发生变化时,才会将父进程的内容复制一份给子进程
使用fork()的示例代码:
pid=fork();
if(pid==0){
printf("child");
} else{
printf("parent");
}
进程的相关概念
进程分类
系统进程,用户进程
前台进程,后台进程
CPU密集型进程,I/O密集型进程
Unix进程家族树:init为根
Windows:地位相同
进程与程序的区别
- 进程更能准确刻画并发,而程序不能
- 程序是静态的,进程是动态的
- 进程是有生命周期的,有诞生有消亡,是短暂的,而程序是相对长久的
- 一个程序可对应多个进程
- 进程可具有创建其他进程的功能
操作系统为每个进程都分配了一个地址空间
进程映像
进程映像是对进程执行活动全过程的静态描述
由进程地址空间内容、硬件寄存器内容及与该进程相关的内核数据结构、内核栈组成。
用户相关:进程地址空间(代码段、数据段、堆和栈、共享库)
寄存器相关:程序计数器、指令寄存器、程序状态寄存器、栈指针、通用寄存器等的值。
内核相关:
- 静态部分:PCB及各种资源数据结构
- 动态部分:内核栈(不同进程在进入内核后使用不同的内核栈)
上下文切换
将CPU硬件状态从一个进程换到另一个进程的过程叫上下文切换
进程运行时,其硬件状态保存在CPU上的寄存器中:程序计数器、程序状态寄存器、栈指针、通用寄存器、其他控制寄存器的值。
进程不运行时,这些寄存器的值保存在进程控制块PCB中,当操作系统要运行一个新的进程时,将PCB中的相关值送到对应的寄存器中。
线程的引入
为什么需要线程:
- 应用的需要
- 开销的需要
- 性能的需要
应用的需要
典型的应用:Web服务器
工作方式:从客户端接受网页请求(http协议)
从磁盘上检索相关网页,读入内存
将网页返回给对应的客户端
如何提高服务器工作效率?
网页缓存(Web page cache)
构造服务器的三种方法:
- 多线程:有并发、阻塞系统调用
- 单线程进程:无并发、阻塞系统调用
- 有限状态机:有并发、非阻塞系统调用、中断
开销的需要
进程时间和空间开销大,限制了并发度的提高,而线程的开销小
创建一个新线程花费时间少;撤销一个新线程花费时间少;两个线程切换花费时间少;线程之间相互通信无需调用内核(同一进程内的线程共享内存和文件)
性能的需要
多个线程,有的计算,有的I/O
进程的两个基本属性:
- 资源的拥有着(依然是进程)
- CPU调度单位(线程继承了这一属性)
线程:进程中的一个运行实体,是CPU的调度单位,有时将线程称为轻量级进程
线程的属性: - 有标识符ID
- 有状态及状态转换->需要提供一些操作
- 不运行时需要保存的上下文(程序计数器等寄存器)
- 有自己的栈和栈指针
- 共享所在进程的地址空间和其他资源
- 可以创建、撤销另一个进程(程序开始是以一个单线程进程方式运行的)
线程机制的实现
- 用户级线程
- 核心级线程
- 混合线程
用户级线程
优点:
- 线程切换快
- 调度算法是应用程序特定的
- 用户级线程可运行在任何操作系统上(只需要实现线程库)
缺点: - 内核只将处理器分配给进程,同一进程中的两个线程不能同时运行在两个处理器上
- 大多数系统调用是阻塞的,因此由于内核阻塞进程,故进程中所有线程也被阻塞