AQS子类ReentrantLock类lock()方法调用compareAndSetState()
对于每个继承了AQS的子类如ReentrantLock,Semphore,CountDownLatch等等都会调用compareAndSetState方法。以ReentrantLock.lock()方法为例:加锁时会调用compareAndSetState方法expected=0,update=1,compateAndSetState调用成功则加锁成功,否则加锁失败,线程进入等待队列。
AQS-compareAndSetState()
其中stateOffset变量是在对象初始化的时候赋值的,值为相对对象基址的偏移量。并且具体的变量名为state且用volatile关键字来修饰。这里有个疑问为什么需要用volatile来修饰state? 如果不用volatile修饰state会出现什么问题?
JNI native ompareAndSwapInt()实现
接着看unsafe.compareAndSwapInt(this,stateOffset,expected,update)方法:这是通过JNI访问的本地方法(操作系统native程序),作用是读取传入var1在内存偏移量为var2的值与期望值var4(excepted)比较。相等就把var5(update)的值赋值到偏移量为var2的变量,返回true。不相等就取消赋值,方法返回false。
compareAndSwapInt的native实现:unsafe.cpp。obj对应var1,offset对应var2,e对应var4(expected),x对应var5(updated)
操作系统 Atomic的cmpxchg方法:
Atomic的cmpxchg,这个类的实现跟操作系统有关,跟CPU架构也有关。updated的值对应exchange_value,dest对应address并且需要为volatile的,compare_value对应expected。
汇编cmpxchg指令
cmpxchg dword ptr[edx](目的操作数),ecx(源操作数)指令的意思是 :
1. dword ptr[edx]为获取地址为edx所在的int值,即dest地址所在的值,由于这个变量地址是volatile的,所以执行这条指令必须从主存中加载而不是从CPU高速缓冲区获得。这个也可以解释state变量为什么需要是volatile的,
mov edx, dest // 步骤1 将state变量的地址存到edx
mov ecx, exchange_value// 步骤2 // 将update值存到ecx
mov eax, compare_value// 步骤3 //将excepted放到eax
LOCK_IF_MP(mp) // 步骤4 //判断如果是多核执行指令前就加锁,锁住总线
cmpxchg dword ptr[edx],ecx //步骤5 //如果dest地址所在的值与寄存器eax的值相等,就将ecx寄存器中的值写到dest地址,如果不相等,将目的操作数(dest地址所在的值)赋值到eax寄存中。
问题一:如果state不是volatile类型有什么问题?
两个线程T1,T2同时执行到步骤3,如果执行到步骤3之前,CPU的高速缓冲区有值,执行dword的时候会直接加载缓冲区的值,并不会立即写到主存并通知其他CPU更新缓冲行。这时候如果state=0,expected=0,updated=1,T1,T2两个线程同时调用compareAndSetState(0,1)都会执行成功,并且State值为1。这就出现数据可见性的问题,互斥锁的作用就失效了。
问题二: 为什么多核时需要在步骤4的时候加锁?
假设T1,T2两个线程在两个单独的CPU上同时运行到步骤5,这时候两个线程同时执行cmpxchg指令,即使dword ptr[edx]会去获取主存中的值并发信号通知其他CPU缓冲行无效,由于执行步骤5之前没有加锁#lock指令,有可能两个线程正好同一时刻各自执行指令cmpxchg,就会出现同时获取到主存的值,并在指令执行结束通知对方高速缓冲行的值失效。这样也会出现T1,T2两个线程同时调用compareAndSetState(0,1)都会执行成功,并且State值为1,互斥锁的作用就失效了,两个线程都能加锁成功。
问题三: 单核为什么不需要加锁
假设T1,T2两个线程执行到步骤3,这时候T1先执行步骤5成功,线程切换,T1交出CPU使用权,T2线程开始执行步骤5,执行cmpxchg指令比较state与expected时候会发现state已经是1,expected是0,两者不相等失败,执行失败,T2加锁失败。