最近看了一下java中多线程并发同步问题。
一、对于开发中做键值对的操作我们常用的Map来存储对应信息。
Map map = new HasMap();
或
Map map = new HasTable<>();
Array以及Linked一样,只是表示不同数据存储结构。
对于HashMap和HashTable来说,主要区别点在于:
1、HashMap是线程不安全的,而HashTable是采用synchronized来进行整体的锁同步的。
2、HashMap的key和value都可以是null,而HashTable不接受这种操作。
3、iteator的区别
故:对于单线程操作来说不存在数据同步的问题,使用HashMap优于HashTable,HashTable的synchronized锁会导致性能较低。而对于多线程操作Map的case来说,数据的同步性是最重要的,HashTable可以满足需求。
二、
HashTable虽然可以保证数据的同步性,但是HashTable是通过synchronized锁方式来实现的,而一个HashTable是一把锁来控制的,
如上就是HashTable的实现方式,全局采用一个数据结构来保存数据并对操作数据的方法进行synchronized同步,这样虽然保证了数据的同步性,但是效率较低,尤其在多线程中一个线程获取到锁,其他线程即使操作其他方法也需要等待,在代码实现有问题的某些情况下甚至会导致cpu占用100%,死锁的产生。
在java5以上建议使用ConcurrentHashMap来替代HashTable进行多线程时的操作。
ConcurrentHashMap将数据进行再哈希,把数据分段,每一段数据有自己的锁,这样不同数据分段间的数据对于锁的获取释放互不影响。
三、java内存模型与volitale关键字
对于内存模型来说,在程序工作时,cpu负责计算,存储负责数据。存储有处理器的L1\L2 cache memory。
对于线程来说,分为堆内存与栈内存,堆内存是进程所持有的共有的,每个线程的数据使用路线为:
堆内存----->copy到私有内存引用副本------>操作--------->未来时机刷新堆内存
而在具体的操作需要关注的三个点:
1、原子性
如i=10是原子操作,i=j,i++不是原子操作,简单来说,原子操作是要么一次性执行完,要么不执行,不存在执行中被调度或其他中断。
一般来说,i=10只需直接刷新内存中值即可,一步完成,而对于i++这样的操作,需要读取,自增、刷新内存三步,所以不是原子的。
对于Fragment以及转账等业务一般是通过开启事务来保证操作的整体原子性。
目前java也提供了一些封装的保证基本类型各种操作的整体原子性的类,如AtomicInteger等。
2、可见性,
可见性是指一个线程对于变量的操作应该对于其他线程可见,避免数据的不同步,volitale就是保证可见性的,一个被volitale修饰的变量,如果在一个线程中修改,会强制立即刷新到内存,且其他线程已读取并缓存在私有内存中的对应变量值会失效,其他线程的后续读取会无法命中,重新来公共内存加载读取。
3、有序性
对于代码来说,书写的顺序并不等同于在编译器或处理器中真正执行的顺序,编译器会对生成的代码进行优化重排,但是重排的前提是保证最终的执行结果不变!
这种优化重排执行顺序的处理在单线程中是OK的,最终的结果不变。但是对于多线程来说,线程的调度无法保证各个线程细化到具体代码行的执行顺序。这样如果线程间有数据依赖,就会导致结果不可预期。
volatile的作用并不会阻止代码重排,但是volatile就像一个分界线,重排只会发生在volatile的前后代码块儿内部,不可能越过volitale进行重排。
看起来volatile如同synchronized一样既保证数据的立即可见性也保证执行的一定有序性。
但是在多线程中还是要谨慎使用volitale,因为这个关键字无法保证变量操作的原子性。
如:
volitale int i=0;
i++;
两个线程都进行这种操作,如果线程1已经命中成功读取i的值,此时线程中断,此时没有改变值,所以并不会刷新内存。
线程2执行操作后, i变为1,此时刷新内存,但是线程1已经执行完读取的操作,所以即使线程私有内存失效也无法影响cpu操作的值。最终结果还是1。
当然这些case是很极端的,但是要充分理解操作的原子性。真正的执行过程可能在硬件上可能分为很多步骤。