前言
接触了这么久同步、异步、阻塞、非阻塞也没正儿八经总结过,还是浑浑噩噩的,网上此类文章特别多,但都没办法解释我的困惑。为什么要叫同步/异步这种名字,阻塞与非阻塞又是相对谁来说的,这些都不讲,死记硬背吗?臣妾做不到!图片来源于网络,侵删!
一:基本概念
1、同步
最开始应该是两个人步伐一致,也就是你迈一步的同时我也迈一步,我迈步的时候你不能干别的事,就像连体婴儿,一个上厕所的时候另一个必须得跟着去。
放到计算机里同步是相对谁来说的?
答:用户空间(线程)IO操作和内核空间(线程)IO操作
啥是用户空间和内核空间?
答:空间本质上就是内存,用户空间是指用户进程所占用的内存,内核空间指的是系统进程所占用的空间,你玩的windows开机的时候就已经划分好了,这块内存归你,那块内存归系统,你不能在系统占用的内存上瞎搞。
同步体现在哪?
答:同步就是说你内核线程IO读写的时候,我用户线程得等着你完成IO,干不了旁的事儿,这里的重点就在于必须等待对方把事情做完我才能做别的事。
2、异步
啥是异步?
答:你内核线程在IO操作的时候,我用户线程不跟着你,而是我想干啥就干啥,等你IO完成之后你可以通知我你IO完事了,得到通知之后我再去选择对这些数据做操作。
同步与异步的区别?
答:同步就是你烧一壶水,你要么一直在旁边守着等着水烧开(同步阻塞),要么一会儿来一趟看水烧开没(同步非阻塞)。异步就是水烧开了会有人通知你,不用你亲力亲为的去监督这件事。
3、阻塞
啥是阻塞?
答:阻塞就是把线程堵住了,线程不能去干别的事。阻塞情况下用户线程读取内核空间数据,如果此时还没有数据就会被堵住,一直到有数据才返回。
阻塞与IO有啥关系?
答:当内核空间没有发生IO读写之前,用户线程就等待操作内核空间IO好的数据。
阻塞与同步是一回事儿吗?
答:显然不是,同步针对的是IO操作,阻塞针对的是线程对象。即便内核空间没有IO操作,用户线程同样会发生阻塞。
4、非阻塞
啥是非阻塞?
答:非阻塞就是线程没被堵住,想干啥干啥。对非阻塞情况,用户线程读取内核空间数据,不管此时有没有数据,用户线程都直接返回。
归纳
A:阻塞与非阻塞是针对线程来说的,阻塞可能发生在IO期间也可能发生在IO之前。
B:同步与异步是针对IO操作来说的,同步是用户线程一直盯着IO直到完成,异步是用户线程在IO完成时会收到通知。
二、组合概念
1、同步阻塞IO
同步体现在IO完成之前用户线程不能做别的事情。
阻塞体现在用户线程从发送read请求开始一直到内核线程完成IO读写和数据拷贝都是堵住的。
2、同步非阻塞IO
同步体现在IO完成之前用户线程不能做别的事情。
非阻塞体现在用户线程发送read请求之后没有被堵住而是立刻返回。
这里体现了同步与阻塞的区别,即虽然线程返回了,但是线程在没拿到结果之前干不了别的事情。
三、IO多路复用
1、IO多路复用之前
第一阶段:每当有连接到来的时候系统都会创建新的进程或者线程去做IO处理和逻辑处理。第一阶段的问题在于海量连接需要创建海量线程,浪费资源。
-
第二阶段:预先创建好线程和进程池,每当有连接到来的时候就从池子里拿进程或者线程去做IO处理和逻辑处理。第二阶段的问题在于,如果有多个客户端连接,一个线程可能会阻塞在IO请求上,不能为其他连接提供服务。
-
第三阶段:还是预先创建好线程或进程池,提出一个线程轮询所有连接,有IO就执行,没IO就直接返回。第三阶段的问题在于如果有成千上万个连接,那么轮询处理会不及时。
2、IO多路复用
上面三个阶段都无法处理海量连接,IO多路复用技术实现了所有连接共用同一个阻塞对象,处理线程就在这个阻塞对象上等待。当某个连接有新的数据可以处理的时候操作系统会通知等待的处理线程进行IO读写和逻辑处理。
IO多路复用不用一个线程去轮询所有连接,而是该线程阻塞在一个阻塞对象上等待通知,一般这个阻塞对象可以是select epoll poll等,这些对象会把IO封装成对应事件。阻塞对象就像一个过滤器,左边是内核线程的IO操作,右边是IO操作之后封装好的IO事件。
总结
IO多路复用应该算作异步阻塞
异步体现在,用户线程在内核线程IO操作完成之前没有强制其不可以做别的事情。
阻塞体现在,用户线程一直等待,直到内核线程通知有可处理的事件。