并发编程挑战
并发和串行,并发不一定比串行快,在不超过百万次操作时,并发比串行慢,原因在于线程有创建,上下文切换的时间开销。
减少上下文切换:1. 无锁并发,2CAS算法,3使用最少线程,4单线程多任务调度。
jstack 3117 >/home/lemon/dump14 导出所有线程的信息,进行JVM调优可用。
避免死锁的常见方法
1.避免一个线程同时获取多个锁,包含重入锁。
2.避免一个线程占用多个资源,尽量一个锁只占用一个资源
3.使用定时锁,lock.tryLock(timeout) 代替内部锁机制。
4.有数据库锁,加锁,解锁都放在一个数据库连接中。
Volatile与Synchronized
volatile : 原理与过程:属性被修饰后,经过编译会出现两个汇编代码指令。这个指令会做两件事。1.将当前处理的属性数据写回系统内存中【原理:多处理器会使用缓存一致性机制,锁住缓存,确保修改一致性,同时也叫缓存锁定】。2.将其他处理器的缓存无效。【原理:处理器使用MESI协议维护内部缓存和其他处理的缓存一致性。一旦共享的内存地址改变,那么嗅探器使其他缓存失效。下次读取直接从内存中捞取】
volatile优化: 部分处理器高速缓存行是64字节宽,而LinkedTransferQueue这个出栈入栈类,将共享变量 追加到64个字节,这样填满高速缓冲区的缓冲行,避免头结点和尾节点加载到同一个缓存行,这样避免修改的时候,因为缓存一致性,把头部和尾部都锁住。当然如果缓存行不是64字节的不适用,共享变量不是平凡更改的也不使用。
Synchronized: 1. 用在普通方法,锁的是当前实例对象。2.用在静态同步方法,所得是类的class对象。3.用在同步方法块,锁的是synchronized括号的对象。
Synchronized: JVM在编译代码后,在同步代码开始位置插入monitorenter,在结束位置插入monitorexit。必须是一对对的,当线程执行到monitorenter就开始尝试获取对象的锁。锁是存在java对象头中。
锁的升级
在JDK1.6以后,锁升级为: 无锁状态--偏向锁状态--轻量级锁--重量级锁, 可升不能降。目的是提高获得锁和释放锁的效率。
偏向锁:当一个线程访问同步块时,对象头在mark Word里记录线程的ID,以后线程进入退出不需要CAS加锁,解锁,只需要判断markWord是否有当前线程即可,如果有,则获取锁,没有则看markWord标识是否设置成1,有则尝试使用CAS指向自己,没有则CAS竞争锁。线程1代表初始化,线程2代表撤销偏向锁。
轻量级锁 : JVM 先创建一个空间存放锁记录,然后先将对象头中的markWord复制到锁记录。然后CAS修改mark Word指针,如果成功则获取锁,失败则表示有并发竞争,使用自旋获取。 解锁: CAS将原来复制的那份markWord换回对象头,成功则解锁,失败则锁变为重量级锁。这个时候只有等待释放锁后,唤醒其他线程,然后再争夺锁。
原子操作及其原理
缓存行: 缓存中最小的操作单位。
比较并交换: compare and swap. 大名鼎鼎的CAS。操作时,先输入旧值,没变化就替换,变化了则不替换。
处理器通过对缓存或总线加锁保证内存操作的原子性。基于总线锁:【原理:处理器提供LOCK#信号,当有处理器发出这个信号,其他处理器就阻塞,保证原子性。】。基于缓存锁:【总线锁开销很多,因为把CPU和内存都锁住了,在高速缓存行中发出Lock#信号,并使用缓存一致性机制阻止两个以上处理器缓存往内存写,并使内存行无效。类似volatile过程。】
CAS总结
ABA问题: 一个值为A,然后变为B,再变成A, 根据CAS,对比发现值没变,但实际是变了,解决方案是追加版本号,例如Atomic包中的AtomcStampedReference解决ABA。
循环时间开销大:如果自旋CAS长时间不成功,CPU会开销大,JVM支持处理器的pause指令则可以延迟流水线执行指令,避免退出循环时,因为顺序冲突,引起CPU流水线清空。
只能保证一个共享变量原子操作。 无法保证多个,要么变成一个变量,要么用锁。
总之: CAS为是一种乐观锁, synchronized是独占式锁,悲观锁。CAS提升了部分效率。
缓存一致性协议(MESI协议)
所有的服务器运行的原理是, 进程中运行某一个线程的时候,会从主存中复制一份数据到自己的工作空间,也就是告诉缓存区中,然后开始业务操作和数据修改,然后再将这个数据返回到主内存中。然后清空自己的工作区间。
如果同时在两个处理器进行处理, 就会出现缓存不一致的情况, 这个时候有两个方案解决,一个是基于LOCK#信号锁住总线,上面有讲述。 这样会导致CPU运行效率差。
比较好的第二种方法则是 缓存一致性协议:当CPU写数据时,如果发现操作的变量是共享变量,即在其他CPU中也存在该变量的副本,会发出信号通知其他CPU将该变量的缓存行置为无效状态,因此当其他CPU需要读取这个变量时,发现自己缓存中缓存该变量的缓存行是无效的,那么它就会从内存重新读取。
线程通信
线程A,将本地内存值刷新到共享内存中, 其他线程,在主内存中获取最新值,更新到自己本地内存中。
重排序
有时候为了提高性能,编译器和处理器会对指令进行重新排序。大致分为以下三类
1.编译器优化重排序。可以改变语句的执行顺序。
2. 指令级并行的重排序。处理器将多条指令重叠执行,如没依赖性,处理器改变语句对应的机器指令执行顺序。
3. 内存系统重排序。
模型
jdk5以后,均采用JSR-133模型,且使用happends-before概念。前一个操作,对后一个操作可见。 顺序一致性内存模型
参考大神图书《Java并发编程艺术》总结。