进程是资源管理的最小单位,线程是程序执行的最小单位。进程管理着资源(比如说CPU,主存,文件等),而将线程分配到某个CPU上执行。在操作系统设计上,从进程到线程,最主要目的是更好地支持多CPU系统和减小上下文切换的开销。
进程的状态
系统为了充分利用资源,对进程区分了不同的状态,为“新建、运行、阻塞、就绪和完成”:
- 新建:进程正在被创建
- 运行:进程正在运行
- 阻塞:进程正在等待某一事件发生
- 就绪:系统正在等待CPU来执行命令
- 完成:进程已经结束,系统正在回收资源
CPU按时间片分配给各个进程使用,每个进程都有自己的运行环境以使得在CPU做进程切换(上下文切换)时不会“忘记”该进程已计算了一部分的“半成品”。从DOS的概念讲,进程的切换都是一次“DOS中断”处理过程,包括三个层次 :
1)用户数据的保存:包括正文段(TEXT)、数据段(DATA,BSS)、栈段(STACK)、共享内存段(SHARED MEMORY)的保存
2)寄存器数据的保存:包括PC(指向下一条指令地址),PSW(处理机状态字),SP(栈指针),PCBP(进程控制块指针),FP(指向栈中一个函数的local变量的首地址),AP(指向栈中函数调用的实参位置),ISP(中断栈指针)以及其他的通用寄存器等
3)系统层次的保存:包括proc,u,虚拟存储空间管理表格,中断处理栈。以便于该进程再一次得到CPU时间片时能正常运行。
常用的多进程编程的系统调用
创建一个新的进程
#include <unistd.h>
#include <sys/types.h>
pid_t fork();
调用产生一个新的进程,叫“子进程”,是调用进程的一个复制品。调用进程叫“父进程”,子进程继承了父进程几乎所有属性。
子进程是对父进程的一个拷贝。
进程:
- 代码段(程序代码)
- 堆栈段(局部变量、函数返回地址、函数参数)
- 数据段(全局变量、常数)
在linux中,系统调用fork后,内核为完成系统调用fork要进行几步操作:
- 为新进程在进程表中分配一个表项。系统对一个普通用户可以同时运行的进程数是有限的,对超级用户没有该限制,但是不能超过进程表的最大表项的数目。
- 给子进程一个唯一的进程标识号(PID)。该进程标识号其实就是该表项在进程表中的索引。
- 复制一个父进程的进程表项的副本给子进程。内核初始化子进程的进程表项时,是从父进程处拷贝的。所以子进程拥有与父进程一样的uid、当前目录、当前根、用户文件描述符等。
- 把与父进程相连的文件表和索引节点表的引用数加1.这些文件自动地与该子进程相连。
- 内核为子进程创建用户级上下文。内核为子进程的代码段分配内存,并复制父进程的区内容,生成的是进程的静态部分。
- 生成进程的动态部分,然后对父进程返回子进程的pid,对子进程返回0.
简单说,fork()调用成功后,分别返回两个整数——对父进程返回>0的整数,对子进程返回0.
举个例子:
#include <sys/types.h>
#include <unistd.h>
#include <stdio.h>
#include <stdlib.h> // exit()
int main()
{
pid_t pid; // 进程号
char *message;
int n;
printf("fork program starting\n");
pid = fork(); // <==> pid_t fork(void) 包含在头文件<sys/types.h>和<unistd.h>中
switch(pid) // 进程会根据pid不同,有选择地执行各自的代码
{
case -1:
perror("fork failed");
exit(1);
case 0: // fork函数返回新进程的pid,新进程为0(即子进程)
message = "This is the childprocess";
n = 5;
break;
default:
message = "This is the parentprocess";
n = 3;
break;
}
for(; n>0; n--){
puts(message);;
sleep(1);
}
exit(0);
}
执行效果如下:
下面是这个程序在执行过程中的示意图:
父进程和子进程的执行的代码都和process1_fork.c中代码一致,但是fork根据不同进程返回不同的PID,其实父子进程的实际有效代码部分是不同的:
换句话说就是,进程会根据PID的不同,有选择地执行各自的代码。