以下是读书笔记:
Java内存模型
Java内存模型规定了所有的变量都存储在主内存中。
每条线程都有自己的工作内存。
内存模型定义的操作
对于主内存和工作内存之间具体的交互协议,Java内存模型中定义了以下8种操作来完成,虚拟机实现时必须保证每一种操作都是原子的、不可再分的。
1. lock 。 作用于主内存的变量,把一个变量标识为一个线程独占的状态。
2. unlock 。 作用于主内存的变量。 把一个变量从锁定状态释放出来
3. read 。 作用于主内存的变量。把变量的值从主内存传输到线程的工作内存中,以便随后的load动作使用。
4. load 。 作用于工作内存的变量,把read 操作从主内存中得到的值放入工作内存的变量副本中。
5. use 。 作用于工作内存的变量,它把工作内存的变量值传递给执行引擎
6. assign 。 作用于工作内存的变量。把一个从执行引擎接收到的值赋给工作内存的变量。
7. store 。 作用于工作内存的变量。把工作内存中一个变量的值传送给主内中,以便后面的write 操作使用。
8. write 。 作用于主内存的变量。它把store操作从工作内存中得到的变量的值放入主内存的变量中。
所以要把变量从主内存复制到工作内存中,就要顺序的执行read和load操作。从工作内存写到主内存就需要顺序执行store和write操作。
注意的是,顺序执行不代表连续执行,比如read a , read b ,load a ,load b
是完全可行的。
操作的规则
内存模型还规定了在执行上述8中操作时必须满足如下规则:
1. 不允许 read和load,store和write之一的操作单独出现。
2. 不允许一个线程丢弃它最近的assign操作。就是说assign完必须要写回主内存。
3. 不允许一个线程无原因的把数据同步回主内存,就是说没assign过,不能写到主内存中。
4. 一个新的变量只能在主内存中"诞生"。
5. 一个变量在同一时刻只允许一条线程对其进行lock操作,但lock操作可以被同一条线程重复执行多次,多次lock后,只有执行相同次数的unlock操作,变量才会被解锁。
6. 如果对一个变量执行lock操作,那将会清空工作内存中此变量的值,在执行引擎使用这个变量前,需要重新执行load或assign操作初始化变量的值。
7. 如果一个变量没有被lock操作锁定,那就不允许对它执行unlock操作,也不允许去unlock一个被其他线程锁定住的变量。
8. 对一个变量执行unlock操作之前,必须先把此变量同步回主内存中。
volatile 型变量的特殊规则
volatile 关键字可以保证变量的可见性和保证不发生指令重排序。
java内存模型规定对于volatile进行read、load、use、assign、store、write操作的时候要满足一些规则:
假设V、W表示两个volatile变量,T表示一个线程
1. 每次使用V前必须先从主内存刷新最新的值
2. 每次修改V后都必须立刻同步回主内存
3. 假定动作A是线程T对V实施的use或者assign动作,动作F是和A相关联的load或store动作,假定动作P是和动作F相应的对变量V的read或write动作。类似的,假定动作B是T对W的use或者assign动作,动作G是和动作B相关联的load或store动作,假定动作Q是和动作G对应的对变量W的read或write动作。那么如果A先于B,P一定先于Q。
1和2条规则是volatile的可见性得到了保证。第三条是volatile变量防止指令重排序的保证。
volatile的有序性还可以通过编译成机器码来观察。它会形成一个内存屏障
lock add1 $0x0,(%esp)
这样就保证volatile前面的代码都是顺序执行的。(注意这里的顺序也是抽象的,只能保证其他线程看这段代码的结果是有序的)
正常情况下,由于CPU的指令重排序优化。虽然从自身线程来看,重排序依然是有序的(重排序优化是在保证不影响执行结果的情况下发送的)。但是从其他线程来看,就不是有序的。
比如有一个变量flag,初始值是false 。
A线程中执行
初始化配置
flag = true
B线程中执行
if(flag){
读取配置
}
这样,A线程在执行的时候可能由于指令重排序,先执行了flag=true,再初始化。对A线程来说结果是一样的,依旧可以看做是有序的。但是这是B线程读取到flag=true,就去读取配置,就可能读取到尚未初始化完的配置。这时候A中的代码对于B来说就不是有序的。这时候把flag设置为volatile就可以解决这个问题。
并发的3大特征:原子性、有序性、可见性
并发先行原则(happens-before)
先行的含义就是,如果说操作A先行于操作B,就是说发生在操作B之前,操作A产生的影响能被操作B观察到,"影响"包括修改了内存中变量的值、发送了消息、调用了方法等。
8个并发先行原则:
- 程序次序规则: 一个线程内,安装代码顺序,写在前面的操作先行于写在后面的操作。
- 管程锁定规则:一个unlock操作先行发生于后面对同一个锁的lock操作。
- volatile 变量规则: 对一个volatile的写操作先行发生于对这个变量的读操作。
- 线程启动规则:Thread对象的start() 方法先行发生于对此线程的每一个动作。
- 线程终止规则: 线程中的所有操作豆豆先行发生于对此线程的终止检测,我们可以通过Thread.join()方法结束、Thread.isAlive()的返回值等手段检测到线程已经终止执行。
- 线程中断规则: 对线程interrupt()方法的调用先行发生于对中断线程的代码检测到中断时间的发生,可以通过Thread.interrupt()来检测到是否有中断发生。
- 对象终结规则: 一个对象的初始化完成先行于它的finalize()方法的开始。
- 传递性: A先行于B,B先行于C,那么A肯定先行于C。
Java线程的实现
- 使用内核线程实现
- 使用用户线程实现
- 使用用户线程加轻量级进程混合实现
对于Sun JDK来说,它的windows版和linux版都是使用一对一的线程模型实现的,一条java线程就映射到一条轻量级进程之中。
java线程调度
- 协同式 (线程的执行时间由线程本身来控制)
- 抢占式 (由系统来分配执行时间,java使用的就是这种)
状态转换
java语言定义了6种线程状态,在任意一个时间点,一个线程只能有其中的一种状态,这6种状态分别如下:
- New : 创建后尚未启动的线程处于这种状态
- runable : Runable包括了操作系统线程状态中的running和ready,也就是这个状态的线程可能正在执行,也可能在等待cpu为它分配执行时间。
- waiting —— 无限期的等待下去,直到有其他线程唤醒。以下操作可能会造成这种状态:
- 没有设置Timeout参数的Object.wait() 方法
- 没有设置Timeout参数的Thread.join() 方法
- LockSupport.park() 方法
- timed waiting : 处于这种状态的线程也不会分配到CPU的执行时间,不过无需等待被其他线程显式地唤醒,在一定时间之后它们会由系统自动唤醒。以下方法会让线程进入限期等待状态:
- Thread.sleep()
- 设置了Timeout的 Object.wait()
- 设置了Timeout的Thread.join()
- LockSupport.parkNanos()
- LockSupport.parkUntil()
- Blocked:线程被阻塞了,正在等待获取一个排他锁。
- Terminated: 已终止线程的线程状态,线程已经结束执行