前言
这篇文章是关于协程、线程与线程池的总结。相信有不少人曾经和我一样,不理解他们之间的差异和使用场景等等,那么在这篇文章,我尝试使用图解的方式对他们进行一个总结和对比,来了解他们的细节。
线程
首先是线程,考虑有一个单核的CPU、一个有很多任务(Task)的队列和一个线程(Thread),线程从队列拿到任务Task1并准备执行,当CPU调度执行该线程的时候,那么这个时候的执行模型是这个样子的。
正常而言,如果任务都是计算型的任务,线程Thread1会一直执行下去,直到遇到操作系统调度,向线程Thread1发出中断,让线程把CPU让出来以执行别的线程。
但是,当任务有可能造成线程阻塞时,比如磁盘IO、网络IO、线程Sleep等等,CPU可能就没有耐心等待了,CPU会让Thread1收拾好自己的包袱(State)(需要一定的时间),让出CPU;然后让别的线程进来CPU运行。
线程池
线程池是为了减少创建线程和销毁线程时候的开销而发明的,如果总是在需要使用线程的时候才创建线程,又总是在使用完线程之后销毁线程,并且这样的操作很多的话,那么在线程新建和销毁上所耗费的时间将会不少;因而提出将多个线程存放到一个容器里面,每次需要使用线程的时候,将线程拿出来,当线程使用完毕以后,再讲线程放回去,以此来节省创建和销毁线程带来的开销。
还是以上的条件,使用线程池或单线程处理同样的Task时,所面临的CPU的对待是一样的,使用线程池与单线程的区别就在于,处理队列任务的线程是随机的,而不是同一个线程。
通常情况下,线程池都有多个线程,如果线程池只有一个线程,那么情景就会退化到第一种情况。
多线程
多线程是为了利用CPU的多核而存在的,在单核CPU使用多线程没有意义。
所以假设条件做一些变更,考虑有一个双核的CPU、一个有很多任务(Task)的队列和两个线程(Thread),因为CPU是双核CPU,所以CPU能够同时执行两个线程。当两个线程同时从任务队列取任务执行时,执行模型如下。
由于CPU能够同时执行两个线程,所以相比单线程时候的情况,处理的任务的速度会快一些,但单个CPU核的处理速度是没有变化的。
当两个线程其中一个线程遇到阻塞任务时,CPU会将阻塞任务线程调出CPU核,让其他线程使用。
异步(不考虑协程)
异步的意思就是,当调用者发起一个异步调用时,调用者不能立刻得到运行的结果,而是在这个异步调用完成后,发送消息通知调用者,或者由调用者主动查询异步调用的状态以得到运行的结果。
其实以上使用队列的方式就已经是异步调用了,只不过在前面没有强调异步的概念。调用者将回调函数保存在任务里面,等线程把任务执行完,通过回调函数通知调用者;或者调用者保存任务对象的指针或引用,在恰当的时机通过指针或引用,访问这个任务的执行状态。
异步执行任务的本质还是线程,只要存在阻塞任务,线程依然会被阻塞也依然会被请出CPU。
那为什么在高并发的情况下还是推荐异步编程呢?那是因为异步不会阻塞调用者的线程,调用者在发起一个任务的时候,不需要同步的等待结果,而是可以同时去执行别的逻辑,对于执行异步任务的线程而言,阻塞时依然存在的。
协程
协程,英文coroutines,是一种比线程更加轻量级的存在。正如一个进程可以拥有多个线程一样,一个线程也可以拥有多个协程。协程是承载在线程之上的,所以协程和线程的关系看起来像这个样子。
正常情况下,执行的模型是这个样子的。
当线程运行了阻塞任务的时候,任务会主动让出线程,并且将下一个任务调度线程运行,执行的模型是这样子的。需要注意的是,在这个时候,CPU里面正在运行的线程没有变,只是在线程里面执行的任务切换了而已。当Task1阻塞,Task1能够主动让出线程,Task2能够进入线程执行,等Task1处理完阻塞了并且能够继续往下运行,Task1能够重新回到线程执行;在调用者看来就好像Task1和Task2在同时运行一样(每个任务就好像在更小的一个执行单元执行——协程),而且没有CPU线程的切换,这种情况就是协程。
相比CPU切换线程,在线程切换协程有几个好处:
- 切换协程在用户态进行 ,无需系统调用,更快
- 调用者能够自主控制协程切换,更自由
- 没有锁的概念,协程安全,不担心死锁等状况,省去锁的开销