前言
- linux内核不存在整真正意义上的线程。linux将所有的执行实体都称之为任务(task),每一个任务在干年上都类似于一个单线程的进程,具有内存空间、执行实体、文件资源等。但是,linux下不同任务之间可以选择公用内存空间,因而在实际意义上,共享同一个内存空间的多个任务构成了一个进程,而这些任务就成为这个任务里面的线程。
内核线程
- 内核线程又称为守护进程,内核线程的调度由内核负责,一个内核线程处于阻塞状态时不影响其他的内核线程,因为其是调度的基本单位。这与用户线程是不一样的;
- 这些线程可以在全系统内进行资源的竞争;
- 内核空间内为每一个内核支持线程设置了一个线程控制块(TCB),内核根据该控制块,感知线程的存在,并进行控制。在一定程度上类似于进程,只是创建、调度的开销要比进程小。有的统计是1:10。
- 内核线程切换由内核控制,当线程进行切换的时候,由用户态转化为内核态。切换完毕要从内核态返回用户态,即存在用户态和内核态之间的转换,比如多核cpu,还有win线程的实现。
优点
在多处理器系统中,内核能够同时调度同一进程中多个线程并行执行到多个处理器中;如果进程中的一个线程被阻塞,内核可以调度同一个进程中的另一个线程;内核支持线程具有很小的数据结构和堆栈,线程的切换比较快,切换开销小;内核本身也可以使用多线程的方式来实现。
缺点
即使CPU在同一个进程的多个线程之间切换,也需要陷入内核,因此其速度和效率不如用户级线程。
用户线程
- 用户线程在用户空间中实现,内核并没有直接对用户线程进程调度,内核的调度对象和传统进程一样,还是进程(用户进程)本身,内核并不能看到用户线程,内核并不知道用户线程的存在。
- 不需要内核支持而在用户程序中实现的线程,其不依赖于操作系统核心,应用进程利用线程库提供创建、同步、调度和管理线程的函数来控制用户线程。
- 内核资源的分配仍然是按照进程(用户进程)进行分配的;各个用户线程只能在进程内进行资源竞争。
- 用户级线程内核的切换由用户态程序自己控制内核切换(通过系统调用来获得内核提供的服务),不需要内核干涉,少了进出内核态的消耗,但不能很好的利用多核Cpu。目前Linux pthread大体是这么做的。
- 每个用户线程并不具有自身的线程上下文。因此,就线程的同时执行而言,任意给定时刻每个进程只能够有一个线程在运行,而且只有一个处理器内核会被分配给该进程。
优点
线程的切换无需陷入内核,故切换开销小,速度非常快;
缺点
系统调用的阻塞问题:对应用程序来讲,同一进程中只能同时有一个线程在运行,一个线程的阻塞将导致整个进程中所有线程的阻塞;由于这里的处理器时间片分配是以进程为基本单位,所以每个线程执行的时间相对减少。
用户级线程和内核级线程的区别:
- 内核支持:用户级线程可在一个不支持线程的OS中实现;内核支持线程则需要得到OS内核的支持。亦即内核支持线程是OS内核可感知的,而用户级线程是OS内核不可感知的。
- 处理器分配:在多处理机环境下,对用户级线程而言主,内核一次只为一个进程分配一个处理器,进程无法享用多处理机带来的好处;在设置有内核支持线程时,内核可调度一个应用中的多个线程同时在多个处理器上并行运行,提高程序的执行速度和效率。
- 调度和线程执行时间:设置有内核支持线程的系统,其调度方式和算法与进程的调度十分相似,只不过调度单位是线程;对只设置了用户级线程的系统,调度的单位仍为进程。
- 用户级线程执行系统调用指令时将导致其所属进程被中断,而内核支持线程执行系统调用指令时,只导致该线程被中断。
- 在只有用户级线程的系统内,CPU调度还是以进程为单位,处于运行状态的进程中的多个线程,由用户程序控制线程的轮换运行;在有内核支持线程的系统内,CPU调度则以线程为单位,由OS的线程调度程序负责线程的调度。
内核线程与用户线程的联系
一对一模型
- 特点
有了内核线程,每个用户线程被映射或绑定到一个内核线程。用户线程在其生命期内都会绑定到该内核线程。一旦用户线程终止,两个线程都将离开系统。这被称作"一对一"线程映射。(反过来,一个内核线程不一定就会对应一个用户线程)。一般一直使用API或者是系统调用创建的线程均为一对一线程。例如,linux使用clone创建的线程,以及win下使用CreateThread创建的线程。
- 弊端
内核线程数量有限
许多操作系统内核线程调用的时候,上下文切换的开销很大。
混合线程模型
混合线程实现是用户线程和内核线程的交叉,使得库和操作系统都可以管理线程。用户线程由运行时库调度器管理,内核线程由操作系统调度器管理。在这种实现中,进程有着自己的内核线程池。可运行的用户线程由运行时库分派并标记为准备好执行的可用线程。操作系统选择用户线程并将它映射到线程池中的可用内核线程。多个用户线程可以分配给相同的内核线程。
-
多对一模型
- 特点
多对一的模型将多个用户线程映射到一个内核线程。
多对一模型线程的切换速度要快很多(线程之间的切换由用户代码来执行)
- 弊端
如果其中一个线程阻塞,那么所有线程将无法执行。
-
多对多模型
- 特点
将上述两种模型的特点进行综合,即将多个用户线程映射到少数但不只一个内核线程中去。
多对多模型对用户线程的数量没有什么限制,在多处理器系统上也会有一定的性能提升,不过提升的幅度比不上一对一模型。