并发与并行
并发偏重多个任务交替执行,而多个任务之间可能还是串行的。即同一时刻只有一条指令执行,但多个进程指令被快速的轮换执行,在宏观上具有多个进程同时执行的效果。微观上只是把时间分段,使得多个进程快速交替的执行。
并行偏重点在于同时执行。即同一时刻,有多条指令在多个处理器上同时执行,无论是围观还是宏观上,这些指定都是一起执行的。
真正的并行只能出现在多核CPU的系统中。
多线程并发:CPU时间分片给不同的线程轮流使用或者当A线程使用CPU结束后可能遇到了I/O请求或者阻塞,那么现在CPU空闲,此时线程上下文切换到B线程使用CPU,让CPU持续被利用... (现在的I/O请求都是通过DMA方式,DMA方式不通过CPU)
多线程的底层机制是由操作系统实现的,当一个线程遇到IO阻塞时,例如读写文件,操作系统可能会暂时挂起该线程,从而让其他线程优先执行,也就是将多出来的时间片切分给其他的线程,直到等待该线程的IO操作返回,再重新调度该线程运行。
异步与同步
同步就是整个处理过程顺序执行,当各个过程都执行完毕,并返回结果。是一种线性执行的方式,执行的流程不能跨越。一般用于流程性比较强的程序,比如用户登录,需要对用户验证完成后才能登录系统。
异步则是只是发送了调用的指令,调用者无需等待被调用的方法完全执行完毕;而是继续执行下面的流程。是一种并行处理的方式,不必等待一个程序执行完,可以执行其它的任务,比如页面数据加载过程,不需要等所有数据获取后再显示页面。
他们的区别就在于一个需要等待,一个不需要等待,在部分情况下,我们的项目开发中都会优先选择不需要等待的异步交互方式,比如日志记录就可以使用异步方式进行保存。
阻塞非阻塞,同步异步
同步和异步针对应用程序,关注的是程序中间的协作关系(多个任务进程);阻塞与非阻塞更关注的是单个进程的执行状态。
同步:执行一个操作之后,等待结果,然后才继续执行后续的操作。
异步:执行一个操作后,可以去执行其他的操作,然后等待通知再回来执行刚才没执行完的操作。
阻塞:进程给CPU传达一个任务之后,一直等待CPU处理完成,然后才执行后面的操作。
非阻塞:进程给CPU传达任务后,继续处理后续的操作,隔断时间再来询问之前的操作是否完成。这样的过程其实也叫轮询。
例子:
异步与多线程的关系
多线程是实现异步的一种方式,异步是最终目的。异步的实现方式有多种。如JavaScript中没有多线程,但通过回调函数来实现异步。
其他方式如:事件监听,发布/订阅等
异步操作的本质
DMA--直接内存访问,也就是说,拥有DMA功能的硬件在和内存进行数据交换的时候可以不消耗CPU资源。只要CPU在发起数据传输时发送一个指令,硬件就开始自己和内存交换数据,在传输完成之后硬件会触发一个中断来通知操作完成。这些无须消耗CPU时间的I/O操作正是异步操作的硬件基础。所以即使在DOS这样的单进程(而且无线程概念)系统中也同样可以发起异步的DMA操作。
线程的本质
线程不是一个计算机硬件的功能,而是操作系统提供的一种逻辑功能,线程本质上是进程中一段并发运行的代码,所以线程需要操作系统投入CPU资源来运行和调度。
多线程的本质
由操作系统实现的,当一个线程遇到IO阻塞时,例如读写文件,操作系统可能会暂时挂起该线程,从而让其他线程优先执行,也就是将多出来的时间片切分给其他的线程,直到等待该线程的IO操作返回,再重新调度该线程运行。
线程与进程
进程: 进程是计算机中的程序关于某数据集合上的一次运行活动,是系统进行资源分配和调度的基本单位,是操作系统结构的基础。进程是计算机中已运行程序的实体。
线程: 线程是操作系统能够进行运算调度的最小单位。线程是一组指令的集合它被包含在进程之中,是进程中的实际运作单位。一条线程指的是进程中一个单一顺序的控制流,一个进程中可以并发多个线程,每条线程并行执行不同的任务。线程是独立调度和分派的基本单位。同一进程中的多条线程将共享该进程中的全部系统资源,但是自有调用堆栈和寄存器环境。
线程进程都是操作系统的概念。进程是应用程序的执行实例,每个进程是由私有的虚拟地址空间,代码,数据和其他系统资源组成。
线程和进程十分相似,线程比进程小。首先,线程采用了多个线程可共享资源的设计思想;例如,它们的操作大部分都是在同一地址空间进行的。其次,从一个线程切换到另一线程所花费的代价比进程低。再次,进程本身的信息在内存中占用的空间比线程大,因此线程更能允分地利用内存。线程是进程的一部分,CPU调度的是线程;系统为进程分配资源,不对线程分配资源。资源分配给进程,同一进程的所有线程共享该进程的所有资源。 处理机分给线程,即真正在处理机上运行的是线程。 线程在执行过程中,需要协作同步。不同进程的线程间要利用消息通信的办法实现同步。
为什么要多线程?
- 多任务同时进行
- 提高CPU利用率
多线程的实现:每个线程被分配一个时间段,称作它的时间片,即该进程允许运行的时间,使各个程序从表面上看是同时进行的。如果在时间片结束时进程还在运行,则CPU将被剥夺并分配给另一个进程并进行上下文切换。如果进程在时间片结束前阻塞或结束,则CPU当即进行切换。时间片设得太短会导致过多的进程切换,降低了CPU效率;而设得太长又可能引起对短的交互请求的响应变差。将时间片设为100毫秒通常是一个比较合理的折衷。