一、并发基本概念
1.同步(Synchronous)和异步(Asynchronous)
- 同步方法调用一旦开始,调用者必须等到方法调用返回之后,才能继续后续的行为。
- 异步方法更像一个消息传递,一旦开始,调用者会立即收到方法的返回,之后调用者可以继续进行其他操作。而异步方法通常会在另一个线程中执行。
2.并发(Concurrency)和并行(Parallelism)
- 并发偏重于多个任务交替执行,在微观上,多个任务是串行执行,CPU快速的在多个任务之间切换,而在宏观上,就好像是多个任务同时进行。
- 并行则是多个任务真正的同时执行。
3.临界区
临界区用来表示一种公共资源或者说共享数据,可以被多个资源使用,但一次只能有一个线程使用它。
4.阻塞(Blocking)和非阻塞(Non-Blocking)
- 阻塞指多个线程之间回会互相影响,一个线程占用了临界区资源,则其他需要这个资源的线程都必须在临界区中等待资源释放。
- 非阻塞就是没有一个线程可以妨碍其他线程执行,所有线程都会尝试不断向前执行。
5.死锁(DeadLock)、饥饿(Starvation)和活锁(LiveLock)
- 死锁指多个线程在等待其他线程释放资源,但自己不会主动释放自己占用的资源,导致所有相关线程都无限制的等待下去的情况。
- 饥饿指某个或某些线程因为种种原因迟迟无法获得所需资源而导致一直无法执行的情况。比如使用非公平锁时,高优先级线程可以“插队”,有时会导致低优先级线程难以获取资源。
- 活锁指多个线程在无法一次性获取所有需要的资源的情况下,反复主动释放资源再占据资源,导致资源不断在多个线程间跳动,导致没有一个资源可以正常执行的情况。
二、并发级别
由于临界区的存在,多线程之间的并发必须受到控制。根据控制并发的策略,可以划分并发等级。
1.阻塞
一个线程是阻塞的,那么在其他线程释放资源之前,当前线程无法继续执行。使用Synchronized关键字或者重入锁时,得到的就是阻塞的线程。
2.无饥饿
如果线程之间有优先级,则线程调度时会优先满足高优先级的线程。非公平锁允许高优先级线程“插队”,可能会导致低优先级线程进入饥饿状态。而公平锁则不会出现这种情况。
3.无障碍
无障碍是一种最弱的非阻塞调度。两个线程执行时不会因为临界区的问题导致一方被挂起,所有线程都可以直接进入临界区修改数据。线程会在修改后检测修改时是否有冲突产生,一旦有冲突则回滚自己的修改,以此来确保数据安全。
无障碍属于一种积极策略,当系统的冲突不严重时,相比阻塞有着更好的性能,但当系统存在严重冲突时,频繁的数据回滚反而会降低性能。
4.无锁
无锁的并行都是无障碍的,所有的线程都能尝试对临界区进行访问。但是区别是,无锁的并发保证必然有一个线程能够在有限步内完成操作离开临界区。
典型的无锁调用可能会包含一个无穷循环,在循环中线程不断尝试修改共享变量,无冲突则修改成功退出循环,有冲突则重新尝试修改。无锁总能保证有一个线程可以胜出,完成自己的修改。
while (!atomicVar.compareAndSet(localVar, localVar + 1)) {
localVar = atomicVar.get();
}
在Java的SDK中,提供了基于系统原生方法的compareAndSet()
,以实现类似于无锁的原子操作。
5.无等待
无锁只要求每次有一个线程可以在有限步之内完成操作,而无等待则要求所有的线程都要在有限步之内完成,也就是避免饥饿问题。
一种典型的无等待策略是RCU(Read Copy Update):对数据的读不加控制,因此读线程是无等待的,而在写数据时先读取一份数据的副本,然后修改副本的数据,再在合适的时候写回原始数据。
三、JVM
1.原子性(Atomicity)
原子性指一个操作是不可中断的,即使在多个线程一起执行时,一个原子性操作一旦开始,就不会被其他线程干扰。
比如对int变量的赋值就是原子性的。而在32位系统上,对long类型的赋值不是原子性的,因为long的长度是64位,需要两次操作。
2.可见性(Visibility)
可见性是指当一个线程修改了某个共享变量时,其他线程是否能立刻看到这个修改。
由于编译器优化或者硬件优化的缘故,有时CPU1修改一个变量之后会将其暂存到cache或者寄存器中,而不是直接写回内存,这时CPU2同样修改了这个变量,那么此时在两个CPU上同一个变量就存在两个不同值。volatile
关键字可以保证变量只会在内存中读写,以避免一个变量在不同的地方存在不同的值。
3. 有序性(Ordering)
对于一个线程来说,它看到的指令的执行顺序一定会是一致的,这也是程序能正常允许的基础,但对于系统来说,JVM会优化多个线程的指令的执行顺序,以充分利用硬件性能。