即使我死了,埋在土地里,我也要用我腐烂的声带喊出:闲置CPU是可耻。——孔子
进程,线程?并行,并发?
由于单核CPU性能过剩,如此高的性能却只能运行一个程序无疑是极大的浪费,因此多任务操作系统出现了。
操作系统把每个任务映射为一个进程,通过CPU轮询让每个进程轮流运行,让人误以为所有进程都在同时运行,实际上再同一时刻只有一个进程运行,这叫并发。当CPU有多核或者多线程的时候,在同一时刻就会同时有多个进程运行,这叫并行。
随着时代的进步,越来越多的高并发需求。因为创建进程,切换进程,进程间通讯,成本之高,使得多个进程协同运行并不能满足需求,于是多线程出现了。通过在每个进程里创建多个线程,这些线程共享一个进程数据,这几乎弥补了多进程的所有缺点。当今主流操作系统都是多线程操作系统,例如:windows,linux,线程为操作系统最小调度单位,通过调度器,为每一个线程分配时间片。
随着硬件性能的提升,在时间的考验下,多进程的缺点变成了多线程的缺点:创建线程,切换线程,线程间通讯,成本之高。因为单核CPU性能已经足够,很多时候需要的是并发,而不是并行。进程和线程都是由系统接管,并发还是并行都由系统决定。因此人们渴望只并发的多线程,从而协程出现了。
什么是协程?
设想一下:
多个线程处理各自的队列,当队列有任务时,线程依次执行,当队列为空时,线程休眠,如此循环。
如果线程数量上千甚至上万,这些线程同一时刻只有少部分队列有任务,那么操作系统会频繁的挂起线程,激活线程,并且所有线程都会占用系统资源,这会导致系统不堪重负,即使只有少数线程运行,也会让系统变得缓慢,甚至每个线程都需要锁,虽然有许多无锁算法,但这会让编程难度从普通上升到地狱,而操作线程,锁的时间也许远远大于线程执行任务的时间。
如果我们可以拥有自己的线程调度器,可以在应用层随意调度线程,避免线程进入内核状态,避免线程争夺资源,降低线程切换开销,可以在单核CPU高并发榨干性能,这样的多线程就是协程。
如果用协程来完成上述任务,可以解决上述的所有缺点。
由于调度器太底层,几乎把整个语言固定了,几乎只有那些为了高并发而生的语言,才会有调度器,例如:GoLang,ErLang等,这些语言适合编写高并发程序。对于那些不是为了高并发而生的语言,它们也需要协程,但是它们不需要调度器,只要手动调度,这就已经足够了。
用协程取代异步回调
Lua 有协程,没有调度器,即使这样,协程依旧是Lua最强特性没有之一,这一特性经常被生手忽略,因为他们根本想不到该怎样使用协程。
function f()
f1()
f2()
f3()
end
上述代码逻辑很清晰,f()
函数按顺序执行了f1()
,f2()
,f3()
,出于某些原因,也许动画延迟,也许网络请求,也许有意延迟,f1()
,f2()
不能马上得到结果,同时,也不能让线程卡在这等着。因此,这里就变成了异步需求,代码可能变成下面这样:
function f()
f1(function() f2(f3) end)
end
以上逻辑看起来很依旧很清晰,f1()
,f2()
,都接受一个函数作为异步回调,但是在f1()
传参时,明显出现了不和谐代码,因为f3()
要作为f2()
的参数,需要用function() end
产生一个闭包传递。一旦需要执行更多的函数,代码将变得臃肿:
function f()
f1(function() f2(function() f3(function() f4(f5) end) end) end)
end
回到前一段代码:
function f()
f1(function() f2(f3) end)
end
这段代码异步回调函数只有3个,看似逻辑清晰,实际上存在重大隐患,从f()
函数体来看,只能看出f1()
,f2()
分别接受一个函数作为参数,并不能明确f1()
,f2()
,f3()
之间的关系(也许内部压根就没有碰这个参数),这让f()
显得很尴尬,因为f()
作为调用者,却被内部调用的函数带起了节奏,思路瞬间就混乱了,如果异步回调嵌套更深,逻辑混乱程度更是惨不忍睹,俗称:回调地狱。
有没有可能让异步调用,也可以像同步调用那样写呢?用协程可以做到。
local function async(handler)
local runn = coroutine.running()
handler(function()
coroutine.resume(runn)
end)
coroutine.yield()
end
function f()
local co = coroutine.create(function()
async(f1)
async(f2)
async(f3)
...
async(fN)
end)
coroutine.resume(co)
end
f()
内部将f1()
,f2()
,...
,fN()
按顺序异步调用,这段代码看起来是同步的,但它的的确确是异步的。协程可以优雅解决回调地狱问题,当然,这个写法并不固定,可根据具体需求进行编码。
上述代码原理是:
用协程去执行第一个异步函数,同时跳回主程序,因为协程跟主程序在同一线程,因此,在协程里调用跟在主程序调用是一样的,当异步调用完成再跳回协程,继续下一个异步调用,如此循环。
结束语
协程的应用远不止这些,对于没有调度器的协程,它们不能或者很难完成高并发任务,但是依旧可以起到很关键的作用。很多时候,我们只需要可以随意切换上下文,还原上下文就足够了。
异步回调并非没有优势。比如:可以把简单问题搞得复杂,把复杂问题搞出很多问题,让开发者每天都过得充实。