程序:由若干条具有一定功能的指令所组成的解题顺序和步骤
程序是静态的,没有生命周期的概念;而进程是一个动态概念,它是有着自己的生命周期的。
一个程序可以对应多个进程,但是一个进程只能对应一个程序
进程是一个能够独立运行的单位,可以和其他进程并发执行。
进程: 是操作系统进行资源分配和保护的基本单位
线程是进程的一个属性(调度属性),是被系统独立调度的基本单位,是CPU使用的基本单位。
一个进程可以创建多个线程,这些线程共享进程拥有的全部资源
多个线程之间并发执行,切换时快速简便
进程的局限性
1、创建子进程时每次都要把父进程的数据都copy一份,造成资源空间的冗余浪费。
2、子进程和父进程的数据交互比较麻烦。不同的进程位于不同的地址空间,必须通过共享内存或者通信机制。
3、系统在进行进程的调度时还涉及到资源的分配与状态转换等一系列动作,开销大。
进程与线程之间的比较
同一进程的多线程间调度时不引起进程的切换,不同进程的线程间调度,需要进行进程的切换
线程上下文切换时的虚拟地址空间是相同的,但是进程是不同的。因此进程间的切换需要切换页目录以及使用新的地址空间,而线程不需要。
fork()
1.调用一次,返回两次。
2.子进程中fork返回0,父进程中fork返回子进程的PID。原因是:①在子进程中通过调用getppid可以方便的指导父进程的PID;②没有一个函数可以使父进程获得其所有子进程的PID。(所以在fork返回时,将子进程的PID直接返回给父进程)
注:子进程的ID不可能为0,因为PID为0的进程是swapper进程。
3.父、子进程共享正文段,不共享数据、堆、栈段,子进程获得父进程数据、堆、栈段的副本。
注:目前,大多数实现并直接复制父进程的数据、堆栈段,而是使用写时复制(Copy-On-Write)技术,在修改这块内存区域时,才会为被修改的数据创建副本。
4.子进程会获得缓冲区的副本,即fork前进程缓冲区中的数据未被flush掉,则fork后,子进程能够获得父进程缓冲区中的数据。
5.父进程所有被打开的文件描述符都会被复制到子进程中。
注:fork之后处理文件描述符通常有两种情况:
①父进程等待子进程结束;
②父、子进程各自执行不同的正文段(父、子进程各自关闭不需要使用的文件描述符);
6.fork之后父、子进程的区别:
①fork的返回值;
②进程ID不同;
③父进程也不同;
④子进程的tms_utime、tms_stime、tms_cutime和tms_ustime均被设置为0;
⑤父进程设置的文件锁不会被子进程继承;
⑥子进程的未处理的闹钟被清除;
⑦子进程的未处理信号集设置为空集;
7.fork失败的两个主要原因:
①系统中进程数目已经达到上限;
②该实际用户的进程总数达到系统限制;
8.fork的两种用法:
①一个进程希望复制自己,使得父、子进程执行不同的代码段。如父进程监听端口,收到消息后,fork出子进程处理消息,父进程仍然负责监听消息。
②一个进程需要执行另一个程序。如fork后执行一个shell命令。
处理僵尸进程
(1)僵尸进程
定义1:父进程未结束,子进程结束,并且父进程未获取子进程的退出数据;
定义2:一个进程的进程主体释放,而其PCB未释放;
(2)解决僵尸进程
本质是只要让父进程能得到子进程结束的信息后在结束
第一种方法:pid_t wait(int *stat):
阻塞运行:函数被调用后不会立即返回,等待某些条件的发生才会返回;
wait函数会阻塞运行;等待子进程结束才能返回,致使父进程阻塞到wait调用处;
进程的状态
1、五种状态
New:进程已经被创建但是还没被执行
Ready:准备执行(在就绪队列中)
Running:正在执行,占用处理机
Waiting:阻塞中,等待某事件发生或I/O操作结束后才能进入就绪队列中
Terminated:因停止或取消,被OS从执行状态释放