这里对Linux的进程管理与调度做个简单的学习笔记总结。
一、进程线程的概念
进程
:处于执行期的程序以及相关资源的总称。
线程
:站在用户空间来看,它是进程的某一执行路径,站在内核空间来看,它是一种特殊的进程,与进程一样统一由task_struct描述。
二、进程的描述
进程主要由以下几个部分组成:
- 代码段:编译后形成的一些指令
- 数据段:程序运行时需要的数据
- 只读数据段:常量
- 已初始化数据段:全局变量,静态变量
- 未初始化数据段(bss):未初始化的全局变量和静态变量
- 堆栈段:程序运行时动态分配的一些内存
- PCB:进程信息,状态标识等
task_struct结构体:
系统用task_struct(进程描述符)来描述进程,该结构定义在<Linux/sched.h>中,它包含一个具体进程的所有信息。Linux通过slab分配器分配task_struct结构。
pid
:是进程标识值(身份证号)。
它不是无限分配的
cat /proc/sys/kernel/pid_max
32位系统 最多只有32768个进程号
因为进程是系统最小资源分配单位,因此进程内也会有各种系统资源描述指针:
*mm
:内存资源
*fs
:文件系统资源
*files
:文件资源 (fd相关)
*singal
: 信号资源
等等
那么如何组织task_struct? 牵扯到数据结构
链表:遍历进程
树:寻找父子关系
哈希:检索
三、进程的生命周期
对应的进程状态:
状态 | 缩写 | 含义 |
---|---|---|
TASK_RUNNING | R | 正在运行或可运行 |
TASK_INTERRUPTIBLE | S | 可中断的休眠 |
TASK_UNINTERRUPTIBLE | D | 不可中断的休眠 |
__TASK_STOPPED | T | 跟踪状态, 当进程接收到SIGSTOP等signal信息 |
__TASK_TRACED | t | 停止状态,比如被debugger的ptrace() |
EXIT_ZOMBIE | Z | 僵尸状态,即父进程还没有执行waitpid() |
EXIT_DEAD | X | 死亡状态 |
状态切换:
- fork出来就处于就绪态
- 拿到cpu就处于运行态
- 分时调度系统,时间片用完抢占,切回就绪态
- 运行时等资源的时候不能死等切换为睡眠态
- 等到了资源又切回就绪态
睡眠分为两类:
深睡眠
: 必须要等到我的资源来才会醒 ,不响应信号,kill -9 都不行。
浅睡眠
: 信号 和 资源来了 都会醒。
操作系统都需要上面3个状态。但是为什么Linux进程生命周期会有5个状态?
这里多了两个状态:
1 僵尸态
僵尸态就是task_struct还没有消失,但是进程所依附的资源已经释放了,并且父进程还没有调wait4()的一个非常短的临界阶段。
进程刚死的时候会变成僵尸,因为资源已经释放,所以僵尸本身无内存泄漏,它存在的目的是父进程可以查到子进程的死因,父进程wait4()来收尸完成这个状态的结束。
wait_task_zombie(){
...
}
子死父清理。
2 停止态
进程在运行时不去睡眠,人为的让它死,再发个continue信号,又进入就绪态。
简单说停止态就是停而不睡但也不死的状态。睡眠态和停止态的区别是:睡眠态是自己睡的,停止态是被外部主动暂停的。
操作:
ctrl + z 停止
bg/fg 恢复
限制cpu利用率:
cpulimit -l <百分比数> -p <pid>
参考:
宋宝华Linux的进程、线程以及调度
《 Linux内核设计与实现》
http://gityuan.com/2017/07/30/linux-process/