线程是CPU调度的最小单元
在上一篇文章进程那些事系列一何为进程中, 我们提到了一个问题 程序能否运行在线程里?
基于这个问题, 我们来展开我们的讨论:
进程和线程的区别
- 总体: 随着硬件的不断设计和操作系统的发展, 进程的功能发生了翻天覆地的变化, 进程只是资源分配调度的单元, CPU调度的最小单元变成了线程, 所以, 我们常说的并发编程, 也就是并发多线程
- 资源分配: 进程有独立的地址空间, 它需要加载程序的资源, 包括代码段、数据、堆栈等. 而线程是依附在进程里的, 它共享着进程里的所有资源, 每个线程区别在于它们拥有各自的栈、寄存器(注意没有堆)
- 消耗: 由于线程们共享着进程的资源, 所以在进行线程上下文切换时, 消耗资源很小(比起进程间的切换)
- 安全性: 由于线程们共享着进程资源, 当一个线程崩溃时, 其进程也会跟着被摧毁(导致里面其他所有线程也会被摧毁). 但是对于进程来说, 一个摧毁不会影响到其他进程
- 通讯: 进程通信只能靠进程通信的那几种方法, 而线程由于共享着进程的资源, 通过这些资源来通信不仅快捷且方便, 但这也引发出了互斥、信号量等概念
总结一下
线程, 有时候也称做轻量级进程, 是CPU调度的基本单位. 线程与同属于同一进程的其他线程共享进程资源, 同时还拥有各自的栈、寄存器等.
有人说, 如果我不开多线程, 就单单运行一个实例, 它能称自为单进程吗?
系统运行应用, 进程创建时实际上也是创建了一个线程, 来运行程序代码(主线程), 所以不能称自为单进程.(注意, 不同平台有不同细节, 这里不做比较)
线程的生命周期
我们知道并发是以线程为单位的, 那了解线程的生命周期, 有利于我们更好的编写并发程序
- 初始状态
指的是线程已经创建, 但是还不允许分配CPU. 注意, 这里的创建指的是编程层面上的, 在操作系统层面上线程还没创建, 如Java中的 new Thread() - 可运行状态
线程已经准备就绪, 等待分配CPU - 运行状态
当有空闲CPU时, 内核会将CPU分配给一个处于 可运行状态的 线程 - 休眠状态
如果处在运行状态的线程调用 某个阻塞API 或者 等待某个事件可用, 那它会处于休眠状态, 同时释放掉CPU的使用权, 处于该状态的线程永远没有获取CPU的权利, 只能等待事件可用或者阻塞响应后, 线程会从休眠状态 转为 可运行状态 - 终止状态
线程执行完或者出现异常就会进入终止状态, 一旦进入终止状态, 就没有回头的机会了.
了解生命周期后, 当程序出现并发问题时, 我们可以通过了解线程的周期来排查.
互斥(Mutual exclusion)
我们把进程看成家, 线程看成家里的每一个人. 对于有些物品, 我们可以同时使用(电视,空调). 对于有些物品, 我们需要单独使用, 比如说厕所. 那么如何保证互斥性呢(即一个时刻只能有一个人在用), 我们可以上锁, 比如把厕所门锁了
线程也一样, 我们把一些需要单独使用的区域称自为 临界区, 当我们需要访问时, 我们需要给它上锁, 如果已经被锁, 需要排队等待.
谁先来?
按照古人的礼仪, 肯定是谁等的最久谁先来(即先来后到原则). 我们称自为“公平”原则.
那假设有两个人同时来的, 谁先去? 假设一个要赶着去上班, 另一个没事干. 那按照古人的礼仪, 肯定是先让给赶着去上班的, 这就引入了另一个条件, 优先级, Priority
所以当线程在等待某个锁释放时, 如果存在优先级高的(255~1, 255为最高, 1为最低)线程, 它先去. 如果都是同等级别, 按照排队顺序, 先来后到
信号量(Semaphore)
战场转换了, 现在从厕所变成了厨房, 厨房我们可以认为是个半开放地区(你肯定不想全部人都一起涌进), 所以我们设置了规定, 最多N个人可以进入厨房
如何保证厨房只有N个人呢, 肯定不能跟厕所一样里面装一个锁. 这样一个进去锁住后, 其他人就进不去了. 我们可以在门外挂N把钥匙, 每个人想进去厨房的人都需要通过门外的钥匙开门, 出来时在返还钥匙.
假设N的=1, 也能做到互斥的效果. 所以说互斥是特殊的信号量. 但是从本质上, 两者的思想还是不同的
互斥用于保护资源, 管理资源的使用权. 信号量则用于线程调度, 管理资源的使用数量
多个线程去买票, 票这里是个共享资源, 如果不通过互斥加以保护, 就可能会出现 多个线程同买一张票的场景
假设线程C专门等待线程A和线程B的数据, 我们就可以通过 信号量 进行线程的调度(线程调度: 就是一些线程生产, 另外一些线程消费), 信号量可以保证让生产和消费保持合乎逻辑的执行顺序
总结
线程之所以开始流行, 是因为依附在了进程这个载体上, 但每个线程又有各自的栈空间, 当同一进程的线程进行上下文切换时, 消耗低, 响应快.一个进程至少包含一个主线程, 作为程序实际的执行者.
我们从五个方面去比较了进程和线程的区别, 分别是总体, 资源, 性能, 安全, 通讯. 对于线程的生命周期, 主要是在 可运行状态 <-> 运行状态 <-> 休眠状态 三者中来回切换
同时又介绍了并发中最基本的两个机制: 互斥 和 信号量
两者的本质一定要理解在理解, 前者针对的是资源区的互斥和保护(自己加锁,只有自己才可以解), 后者管理资源的使用上限和线程间的调度(任意线程都可调用acquire() 和 release())
参考 Semaphore 和 Mutux的区别
Threads_and_processes
如果有什么疑问和错误, 欢迎指出, 感谢你的支持