1、并发模型一般有两类
阻塞方式 – 通过加锁来实现资源并发
非阻塞方式 - 系统原语实现
I、死锁 VS 活锁
死锁线程相互等待资源,导致无法执行
活锁线程相互谦让资源,导致无法执行 -- 饥饿场景,一直都抢不到资源
活锁可以解开,而死锁无法自动解开
II、自旋锁 VS 互斥锁
自旋锁一般用在多核,当抢占不到资源时,自旋锁会一直再轮询抢占锁;而互斥锁,抢占不到时,线程会休眠,等待唤醒。
从效率上看,自旋锁没有线程切换,效率要高,但一直占用CPU也会对资源浪费。所以,对于长时间占用,单核的这些还是使用互斥锁;多核,非常短时间占用的,则使用自旋锁效率高点
java8 提供了 StampedLock 自旋锁
其中非 阻塞方式(不使用锁),由于高性能和高并发,最近几年越来越被推崇。
III、无干扰(obstruction-free)
IV、无锁(lock-free)
最典型的无锁用法,就是 CAS ,java并发集合中提供了大量的CAS 基础的操作
ABA 问题
主要是线程T1 把 A 操作了 B,又操作回了A, 线程 T2 在第一次读取时,读取的是A,第二次读的是 更改后的A,这样 CAS 操作就是ABA问题。
对于普通的系统基本类型,这没有什么问题,但对于 复杂的数据结构就可能有影响了。
非常类似 数据库事务中的 幻读,两次操作之间,范围没有变,但再中间插入了记录(或者删除了数据)
V、无等待(wait-free)
VI、synchronized vs volatile
volatile 只有可见性,即任何线程的修改可以看到;synchronized 保证可见性和操作原子性。
一个常见的比较 volatile 修饰 引用类型,和 AtomicReference 的区别:
AtomicReference 能够保证里面所有的 域 同时刷新,被其他线程看到;而volatile 修饰的引用多个域 操作不能保证同时被处理,如果域数据之间有依赖就会出现问题
2、线程工作模式
I、并行工作者模式
一个主线程负责派发,多个线程接受派发任务。传统的多线程模型都是基于此,java的并发包大多也是这个模式。
优点:可以方便的增加和减少工作者。
缺点:
a、存在共享资源的抢夺,导致多个线程交互的复杂度和效率的下降。解决的方法:
A> 非阻塞并发方式
比如 java的 Future,把阻塞的方法改成了非阻塞的方法(本质上是交给另一个线程去执行)
B> 可持久化数据结构
这里的可持久化数据结构是指一些 不可变的对象,在函数式编程语言比较常见,在Java中对应的比如 String,CopyOnWriteArrayList
b、工作线程的顺序未知
为了协调线程间的顺序,java并发包中提供了很多资源控制项,比如CountDownLatch/CycleBarrier/Semphore
II、流水线模式
流水线模式也称为反应器/事件驱动模式;使用流水线模式,最有名的就是tomcat;还有akka事件框架(spark调度使用);Netty的 EventLoops
一般使用非阻塞IO来实现,非阻塞IO本质上是一个用空间(代码逻辑复杂度)换时间(IO)的策略,节省了大量阻塞IO模式下等待的过程。以网络通讯来说,多个端口注册到一个selector上,由这个selector去轮询,这样只需要一个线程无需切换,有两个功效:
○、多个IO时可以在一个线程里处理,处理完一个,可以接着处理下一个,向流水线一样,这些IO可以是类似观察者,通过回调函数去派发,也可以直接写在代码里面
○、因为在一个线程里,这个流水线没有和其他线程共享数据,所以数据是线程安全的,这和并行工作者有很大不同
a、actors 模式
AKKA框架
b、CSP 模式