《深入理解 Java 虚拟机》 第五部分
1. Java 线程内存模型
变量:讨论线程的时候,变量是指实例字段、静态字段和构成数组对象的元素,但不包括局部变量和方法参数,因为后者是线程私有的,不会被共享,自然也不存在竞争关系。
Java内存模型规定了所有的变量都存储在主内存中。每个线程还有自己的工作内存,线程的工作内存中保存了被该线程中使用到的变量的主内存拷贝副本(对于具体对象,虚拟机可能不会拷贝整个对象,而是只拷贝线程访问到的字段),线程对变量的所有操作都必须在工作内存中进行,而不能直接读写主内存中的变量。不同的线程之间也无法直接访问对方工作内存中的变量,线程间变量值的传递均需要通过主内存来完成。(volatile 变量依然有工作内存拷贝,只是读写时有特殊的操作顺序性规定)
2. 原子性、可见性与有序性
原子性:即一个操作或者多个操作 要么全部执行并且执行的过程不会被任何因素打断,要么就都不执行。
我的理解就是,当一个线程中的一段代码要操作(读/写)一些变量的值得时候,代码运行的结果不会被其他线程影响。
很多人会说int b = a
不是原子操作,就是因为其他线程可能同时修改了 a 的值,影响了最终 b 的结果。其实这暗含了对b来说,a不是局部变量。如果a、b是同一对{}中间的局部变量,其他线程应该也是看不到a的,并不会修改a的值。只有a是一个实例的成员变量,或者静态成员变量的时候,才会多线程可见。
synchronized 块之间的操作也具备原子性
可见性:当一个线程修改了共享变量的值,其他线程能够立即得知这个修改。
所以这个“可见”,应该是指“可以看见变量发生了变化”。
有序性:线程内表现为串行的语义;如果在本线程中观察其他线程,所有操作都是无序的(因为“指令重排序”和“工作内存与主内存同步延迟”)。
这也说明,指令重排序 不会影响线程内的代码执行的顺序逻辑;虽然进行了重排序,但是线程内并不可感知。
3. 先行发生原则
先行发生原则:在Java内存模型中定义了两项操作顺序之间的偏序关系,如果操作A先行发生于操作B,其实就是说在发生操作B之前,操作A产生的影响能被操作B观察到,“影响”包括修改了内存中共享变量的值,发送了消息,调用了方法等。
Java内存中包括下列一些天生发生的先行发生关系,无须任何同步协助:
程序次序执行规则:在一个线程内,按照代码顺序执行,前面的操作先行发生于书写在后面的操作。
管程锁定规则:一个unlock操作先行发生于后面(时间上的先后)对同一个锁的lock操作。
volatile变量规则:对于一个volatile变量的写操作先行发生于后面对这个变量的读操作。
线程启动规则:Thread对象的start()方法先行发生于此线程的每一个动作。
线程终止规则:线程的所有操作都先行发生于对此线程的终止操作
线程中断规则:对线程interrupt()方法的调用先行发生于被中断线程的代码检测到中断时间的发生。
对象终结规则:一个对象的初始化完成先行发生于它的finalize()方法的开始。
传递性:若A先行于B发生,B先行于C,那么得出A先行于C
(线程间的)时间先后顺序与先行发生原则之间基本没有太大的关系(因为存在“指令重排序”和“工作内存与主内存同步延迟”)。
我们衡量并发安全问题的时候不要受到时间顺序地干扰,必须以先行发生原则为准。
4. Java 线程的实现
对于 Sun JDK 来说,它的 Windows 版与 Linux 版都是使用一对一的线程模型实现的,一条 Java 线程就映射到一条轻量级线程之中,因为 Windows 与 Linux 系统提供的线程模型都是使用一对一的。
而 Solaris JDK可以采用N对M模型。
4. Java 线程的调度
线程调度是指系统为线程分配处理器使用权的过程,主要的调度方式有两种:
协同式线程调度(Cooperative Threads-Scheduling)
这种方式是原始方式,由一个线程执行完通知另一个线程。已经很少使用,很容易造成阻塞。抢占式线程调度(Preemptive Threads-Scheduling)
主流方式,由系统来根据一系列复杂的规则为每个线程分配执行时间,线程的切换不是由线程自己做主(Java可以有Thread.yield()来让出执行时间,但是没有获取执行时间的方式)。不会有一个线程导致整个进程阻塞的问题。
Java 使用的线程调度方式就是抢占式调度。(后续版本可能会提供协程 Coroutimes 方式来进行多任务处理)