线程的使用
每个进程都有一个地址空间和一个控制线程,但是我们经常需要在同一个地址空间里运行多个控制线程,它们协同工作完成任务,线程被需要的理由如下:
- 包含多个线程的进程配合工作的处理速度比单线程快
- 线程比进程更轻量级,创建和销毁线程较之于进程更为高效
- 在多核系统中,多线程更能充分利用资源
比如我们日常使用网易云音乐时,如果该进程只有一个线程,音乐播放本地歌曲的时候我们就不能同时在后台下载歌曲,搜索歌曲的时候就要暂停播放音乐,这显然是用户无法接受的。如果我们采用多线程编程,可以用一个线程播放音乐,一个线程在后台默默地下载音乐,一个线程接受用户输入并搜索结果,用户体验自然非常好。
多线程编程在图像处理和Web服务器开发方面是重头戏。Web服务器可以在等待等待用户请求时阻塞,每当一个请求到达便弹出一个线程处理,可以同时处理大量请求,将应答返回给用户。
线程模型
进程是一个正在执行的程序的实例,用于把资源集中到一起,包括地址空间、打开的额文件,子进程和信号等,进程和进程之间相对独立,而线程共享进程的资源,有着完全一样的地址空间和全局变量,不同的是每个线程有着各自的堆栈。
线程的状态
和进程一样,线程有3种状态:运行(Running),就绪(Ready),阻塞(BLocked)
- Running运行态(使用CPU中)
- Ready就绪态(可运行,等待被调度)
-
Blocked阻塞态(等待外部事件发生)
一个处于运行态的线程在等待用户输入时会发生转换1进入阻塞态,在用户输入时会发生转换2进入就绪态。转换3和转换4可在操作系统的调度下发生。
在用户空间实现线程
线程可在用户空间和内核空间实现。
在用户空间实现线程,内核并不会知道进程内有多个线程,仍把进程当做单线程进程来对待,内核通过其内部的进程表来管理进程,而每个进程内部有一张用于供进程管理线程的线程表。用户空间实现线程的有点是显而易见的:
- 由于不需要陷入内核,线程的创建和销毁完全在用户空间,速度很快
- 每个进程可以制定自己的调度算法
但是其有点完全掩盖不了其缺点:但其中一个线程阻塞时,同一个进程里面的所有线程都会被挂起。比如其中一个线程做I/O操作或是发生缺页故障时(需要从磁盘载入页面到物理内存),该线程会被阻塞,原因是内核管理的是进程。
在内核空间实现线程
现代主流的操作系统是在内核空间实现线程,如下图
和在用户空间实现线程不同,此时线程表移到了内核空间,由内核对所有的线程单独管理。当一个线程阻塞时,内核可根据线程表调用同一进程中的线程或是另外一个进程中的线程,每个线程都是独立的个体,一个线程阻塞就不会像在用户空间中实现的线程那样,阻塞整个进程。
当然,线程的创建和销毁都需要执行系统调用,从用户空间陷入内核空间,上下文切换的代价比较大。