编写线程安全代码的关键
- 在于要对状态访问操作进行管理,特别是对共享的(Shared)和可变的(Mutable)状态的访问
Java中的同步机制
- synchronized
- volatile变量
- 显式锁(Explicit Lock)
- 原子变量
如何将共享的可变的状态变量的访问变为安全的
- 不在线程间共享该状态变量
- 将状态变量修改为不可变的变量
- 在访问状态变量时使用同步机制
有利于设计线程安全类的条件
- 良好的面向对象技术
- 不可修改性
- 明晰的不变性规范
编写并发程序的原则
- 首先使代码正确运行,然后再提高代码的速度;由与并发错误是非常难以重现和调试的,因此如果在某段很少执行的代码路径上获得了性能提升,那么很可能被程序运行时存在的失败风险而抵消
如何理解线程安全
- 在任何情况中,只有当类中仅包含自己的状态时,线程安全才是有意义的
- 线程安全性是一个在代码上使用的术语,但它只是与状态相关的,因此只能应用于封装其状态的整个代码,这可能是一个对象,也可能是整个程序
- 线程安全性的定义中,最核心的概念就是准确性;如果对线程安全性的定义是模糊的,那么就是因为缺乏对准确性的清晰定义
- 多线程准确性:对某个类的行为与其规范完全一致
- 规范:在良好的规范中通常会定义各种不变性条件(Invariant)来约束对象的状态,以及定义各种后验条件(Postcondition)来描述对象操作的结果
- 单线程准确性:所见即所得(we know it when we see it)
- 多线程准确性:对某个类的行为与其规范完全一致
什么是线程安全的类
- 网络上的定义
- 如果某各类可以在多线程中安全的使用,那么他就是一个线程安全的类
- 更准确的定义
- 当多线程访问某个类时,不管运行时环境采用何种调度方式或者这些线程将如何交替执行,并且在主调代码中不需要任何额外的同步或协同,这个类就能表现出正确的行为,那么就称这个类是线程安全的
- 在线程安全的类中封装了必要的同步机制,因此客户端无需进一步采取同步措施
- 当多线程访问某个类时,不管运行时环境采用何种调度方式或者这些线程将如何交替执行,并且在主调代码中不需要任何额外的同步或协同,这个类就能表现出正确的行为,那么就称这个类是线程安全的
无状态对象一定是线程安全的
- 无状态对象计算过程中的临时状态仅存在于线程栈上的局部变量中,并且只能由正在执行的线程访问
- 当在无状态的类中添加一个状态时,如果该状态完全由线程安全的对象来管理,那么这个类仍然是线程安全的
- 在实际情况中,应尽可能的使用线程安全的对象(例如AtomicLong)来管理类的状态。与非线程安全的对象相比,判断线程安全对象的可能状态及状态转换情况要更为容易,从而也更容易维护和验证线程安全性
竞态条件
- 定义
- 在并发编程中,多个线程由与不恰当的执行读写共享数据的顺序而导致出现不正确的结果的情况,就叫做竞态条件(Race Condition)
- 维基百科:竞争冒险(race hazard)又名竞态条件、竞争条件(race condition),它旨在描述一个系统或者进程的输出依赖于不受控制的事件出现顺序或者出现时机
- 换句话说就是正确的结果取决于运气
- 最常见的竞态条件类型:
- 先检查后执行(Check-Then-Act),即通过一个可能失效的观测结果来决定下一步动作
- 自增操作(count++),该操作包括三个步骤:读取count,计算count+1,给count赋值
- 大多数竞态条件的本质:基于一种可能失效的观测结果来作出判断或执行某个计算
- 如何避免静态条件:要避免静态条件问题,就必须在某个线程修改该变量时,通过某种方式防止其他线程使用这个变量,从而确保其他线程只能在修改完成之前或之后读取和修改状态,而不是在修改状态的过程中(即保证类似“先检查后执行”、“读取-修改-写入”这样的复合操作是原子的)
可重入
- Java的线程是可重入的
- 概念:已经获取锁的线程再次进入该锁保护的代码块时不需要从新获取锁
- 粒度:“重入”意味着获取锁的操作的粒度是“线程”,而不是“调用”
- 一种实现:为每个锁关联一个获取计数值和一个所有者线程。当计数值为0时,这个锁就被认为是没有被任何线程持有。当线程请求一个未被持有的锁时,JVM将记下锁的持有者,并且将获取计数值置为1.如果同一个线程再次获取这个锁,计数值将递增,而当线程退出同步代码块时,计数器会相应的递减。当计数值为0时,这个锁将被释放
用锁来保护状态
- 对于可能被多个线程同时访问的可变状态变量,在访问它时都需要持有同一个锁
- 对于每个包含多个状态变量的不变性条件,其中涉及的所有变量都需要由同一个锁来保护
安全性-活跃性-性能
- 安全性:永远不发生糟糕的事情
- 活跃性:某件正确的事情最终会发生,但是不够快
- 单线程中活跃性形式之一:无意造成的无限循环,从而使循环之后的代码无法得到执行
- 多线程中的活跃性包括:死锁、饥饿以及活锁
- 性能:性能问题包括多个方面,例如:服务时间过长、响应不灵敏、吞吐率低、资源消耗过高、可伸缩行较低等
经验
- 通常,在简单性和性能之间存在着相互制约的因素。当实现某个同步策略时,一定不要盲目地为了性能而牺牲简单性(这可能会破坏安全性)
- 当执行时间较长的计算或者可能无法快速完成的操作时(例如,网络I/O或控制台I/O),一定不要持有锁