CPU、内存以及I/O设备都在不断迭代,不断朝着更快的方向努力。但是,在这个快速发展的过程中,有一个核心矛盾一直存在,即三者之间的速度差异。程序里大部分语句都要访问内存,有些还要访问I/O,根据木桶原理,程序整体的性能取决于最慢的操作——读写I/O设备,也就是说单方面提高CPU性能是无效的。为了合理利用CPU的高性能,平衡这三者的速度差异,计算机体系机构、操作系统、编译程序都做出了贡献,主要体现为:
1、CPU增加了缓存,以均衡与内存的速度差异;
2、操作系统增加了进程、线程,以分时复用CPU,进而均衡CPU与I/O设备的速度差异;
3、编译程序优化指令执行次序,使得缓存能够得到更加合理地利用。
增加缓存,带来了可见性的问题
在单核时代,所有的线程都是在一颗CPU上执行,CPU缓存与内存的数据一致性很容易解决,因为所有的线程都在同一个CPU运行,即操作的都是同一个CPU的内存,故一个线程对缓存的写,对另外一个线程来说一定是可见的。如图:
由图可知,当线程A更新共享变量V的值,那么线程B之后再访问变量V,得到一定是V的最新值。
多核时代,每个CPU都有各自的缓存,当多个线程在不同的CPU上执行时,这些线程操作的是不同的CPU缓存,故可见性就不是那么容易保证了。
一个线程对共享变量的修改,另外一个线程能够立刻看到,称为可见性。
线程切换,带来原子性问题
操作系统允许某个进程执行一小段时间,过了这一小段时间,操作系统就会重新选择一个进程来执行(任务切换),这小段时间称为”时间片“。在一个时间片内,如果一个进程进行一个IO操作,例如读个文件,这个时候该进程可以把自己标记为”休眠状态“并出让CPU的使用权,待文件读进内存,操作系统会把这个休眠的进程唤醒,唤醒后的进程就有机会重新获得CPU的使用权了。进程在等待IO时之所以会释放CPU使用权,是为了让CPU在这段时间里可以做别的事情,这样一来CPU的使用率就上来了;此外,如果这时有另外一个进程也读文件,读文件的操作就会排队,磁盘驱动在完成一个进程的读操作后,发现有排队的任务,就会立即启动下一个读操作,这样IO的使用率也上来了。
早期的操作系统基于进程来调度CPU,不同进程间是不共享内存空间的,所以进程要做任务切换就要切换内存映射地址,而一个进程创建的所有线程,都是共享一个内存空间的,所以线程做任务切换成本就很低了。现代的操作系统都基于更轻量的线程来调度,现在提到的”任务切换“都是指”线程切换“。
Java并发程序都是基于多线程的,自然会涉及到任务切换,任务切换是并发编程里诡异Bug的源头之一。任务切换的时机大多数是在时间片结束的时候,现在基本都是使用高级语言编程,高级语言一条语句往往需要多条CPU指令完成,例如count++,至少需要三条cpu指令来完成。操作系统做任务切换,可以发生在任何一条CPU指令执行完,注意,不是高级语言里的一条语句。
所谓的原子性,就是指一个或者多个操作在CPU执行的过程中不被中断的特性。CPU能保证的原子操作是CPU指令级别的,而不是高级语言的操作符。
编译优化,带来了有序性问题
有序性,指的是程序按照代码的先后顺序执行。编译器为了优化性能,有时候会改变程序中语句的先后顺序,但是不影响程序的最终结果。不过有时候编译器及解释器的优化可能导致意想不到的Bug。例如:双重检查再加锁的方式实现的单例模式。
public class Singleton {
static Singleton instance;
static Singleton getInstance() {
if(instance == null) {
synchronized(Singleton.class) {
if(instance == null) {
instance = new Singleton();
}
}
return instance;
}
}
假设有两个线程A、B同时调用getInstance()方法,他们会同时发现instance == null,于是同时对Singleton加锁,此时JVM保证只有一个线程能够加锁成功,假设线程A加锁成功,线程B处于等待状态。线程A会创建一个Sington实例,之后释放锁,锁释放后,线程B被唤醒,线程B再次尝试加锁,此时是可以加锁成功的,加锁成功后,线程B检查instance == null时会发现,已经创建过Singleton实例了,所以线程B不会在创建一个Singleton实例。
这个过程看上去没什么问题,但是问题出在new操作上,new操作分为如下的步骤:
1、分配一个内存M;
2、在内存M上初始化Singleton对象;
3、然后M的地址赋值给instant变量;
但是经过编译器优化后,可能new操作的执行顺序可能会变成这样:1->3->2,当先执行的线程执行至3时,恰好发生了线程切换,切换到别的线程,别的线程执行到了第一个if语句,此时判断结果为false,直接返回instance实例,而instance实例还没有初始化,访问instance实例的时候会出现空指针异常。