Java8之后的ConcurrentHashMap, 舍弃分段锁
JDK 源码中 HashMap 的 hash 方法原理是什么?
tableSizeFor方法
先来分析有关n位操作部分:先来假设n的二进制为01xxx...xxx。接着
对n右移1位:001xx...xxx,再位或:011xx...xxx
对n右移2为:00011...xxx,再位或:01111...xxx
此时前面已经有四个1了,再右移4位且位或可得8个1
同理,有8个1,右移8位肯定会让后八位也为1。
综上可得,该算法让最高位的1后面的位全变为1。
最后再让结果n+1,即得到了2的整数次幂的值了。
0100 0000 0000 0000 0000 0000 0000 0000
向右移动1位
0010 ...
进行|运算,得到结果
0110 ...
向右移动2位
0001 1000 ...
进行|运算,得到结果
0111 1000 ...
向右移动4位
0000 0111 1000 ...
进行|运算,得到结果
0111 1111 1000 ...
向右移动8位
0000 0000 0111 1111 1000 ...
进行|运算,得到结果
0111 1111 1111 1111 1000 ...
向右移动16位
0000 0000 0000 0000 0111 1111 1111 1111
进行|运算,得到结果
0111 1111 1111 1111 1111 1111 1111 1111
最终结果
0111 1111 1111 1111 1111 1111 1111 1111
return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
如果n=9
0000 0000 0000 0000 0000 0000 0000 1000
向右移动1位
0000 0000 0000 0000 0000 0000 0000 0100
进行|运算,得到结果
0000 0000 0000 0000 0000 0000 0000 1100
向右移动2位
0000 0000 0000 0000 0000 0000 0000 0011
进行|运算,得到结果
0000 0000 0000 0000 0000 0000 0000 1111
向右移动4位
0000 0000 0000 0000 0000 0000 0000 0000
进行|运算,得到结果
0000 0000 0000 0000 0000 0000 0000 1111
向右移动8位
0000 0000 0000 0000 0000 0000 0000 0000
进行|运算,得到结果
0000 0000 0000 0000 0000 0000 0000 1111
向右移动16位
0000 0000 0000 0000 0000 0000 0000 0000
进行|运算,得到结果
0000 0000 0000 0000 0000 0000 0000 1111
最高位下的所有位都替换成1,
最后n+1
最高位的上一位替换成1, 低位都是0
最终得到2幂次方,且最接近n的值
为了兼容最大的
01xxx xxxx xxxx xxxx xxxx xxxx xxxx xxxx
所以累积最大移动31位
n |= n >>> 1;
n |= n >>> 2;
n |= n >>> 4;
n |= n >>> 8;
n |= n >>> 16;
hash spread
hash&(length-1) 决定元素在数组中的位置。
HASH_BITS
01111111 11111111 11111111 11111111
static final int spread(int h) {
return (h ^ (h >>> 16)) & HASH_BITS;
}
h^(h>>>16) 低16位和高16位异或运算, 不用管h的高16位。
“扰动函数”: 低16位和高16位异或运算,,以此来加大低16位的随机性;混合后的低位参杂了高位16位的特征, 这样高位信息也被变相保留下来。
putVal方法
/** Implementation for put and putIfAbsent */
final V putVal(K key, V value, boolean onlyIfAbsent) {
if (key == null || value == null) throw new NullPointerException();
// 求hash值
int hash = spread(key.hashCode());
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f;
int n, i, fh;
if (tab == null || (n = tab.length) == 0)
// 初始化数组
tab = initTable();
// 如果数组是空的
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
// 数组中的i位置添加第一个元素
if (casTabAt(tab, i, null,
new Node<K,V>(hash, key, value, null)))
break; // no lock when adding to empty bin
}
// 数组在扩容?
else if ((fh = f.hash) == MOVED)
// 帮助数组扩容
tab = helpTransfer(tab, f);
else {
V oldVal = null;
// 第一个节点,作为锁
synchronized (f) {
// 双重检测
if (tabAt(tab, i) == f) {
if (fh >= 0) { // 链表
binCount = 1;
for (Node<K,V> e = f;; ++binCount) { // 遍历链表。
K ek;
// 如果新key和老key 相同, 则用新值替换旧值
if (e.hash == hash &&
((ek = e.key) == key ||
(ek != null && key.equals(ek)))) {
oldVal = e.val;
// absent缺失的,只有当onlyIfAbsent=false才能用新值来替换旧值, 否则不允许覆盖。
if (!onlyIfAbsent)
e.val = value;
break;
}
// 如果没有重复的,则把新节点添加的链表的结尾
Node<K,V> pred = e;
if ((e = e.next) == null) {
pred.next = new Node<K,V>(hash, key,
value, null);
break;
}
}
}
// 6.当前为红黑树,将新的键值对插入到红黑树中
else if (f instanceof TreeBin) {
Node<K,V> p;
binCount = 2;
// 调用putTreeVal方法,插入新值
if ((p = ((TreeBin<K,V>)f).putTreeVal(hash, key,
value)) != null) {
// key已经存在,则替换。
oldVal = p.val;
if (!onlyIfAbsent)
p.val = value;
}
}
}
}
// 7.插入完键值对后再根据实际大小看是否需要转换成红黑树
// 链表长度最大是8
if (binCount != 0) {
if (binCount >= TREEIFY_THRESHOLD)
// 插入新节点后,达到链表转换红黑树阈值,则执行转换操作
// 此函数内部会判断是树化,还是扩容:tryPresize
// 数组长度要至少64, 才会触发树化, 否则扩容。
treeifyBin(tab, i);
if (oldVal != null)
return oldVal;
break;
}
}
}
addCount(1L, binCount);
return null;
}
treeifyBin(tab, i); 将链表转换成红黑树。将判断是否树化还是扩容。树化、链化
/* ---------------- Conversion from/to TreeBins -------------- */
/**
* Replaces all linked nodes in bin at given index unless table is
* too small, in which case resizes instead.
*/
private final void treeifyBin(Node<K,V>[] tab, int index) {
Node<K,V> b; int n, sc;
if (tab != null) {
if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
tryPresize(n << 1);
else if ((b = tabAt(tab, index)) != null && b.hash >= 0) {
synchronized (b) {
if (tabAt(tab, index) == b) {
TreeNode<K,V> hd = null, tl = null;
for (Node<K,V> e = b; e != null; e = e.next) {
TreeNode<K,V> p =
new TreeNode<K,V>(e.hash, e.key, e.val,
null, null);
if ((p.prev = tl) == null)
hd = p;
else
tl.next = p;
tl = p;
}
setTabAt(tab, index, new TreeBin<K,V>(hd));
}
}
}
}
}
/**
* Returns a list on non-TreeNodes replacing those in given list.
尝试预先调整表的大小以容纳给定数量的元素。
*/
static <K,V> Node<K,V> untreeify(Node<K,V> b) {
Node<K,V> hd = null, tl = null;
for (Node<K,V> q = b; q != null; q = q.next) {
Node<K,V> p = new Node<K,V>(q.hash, q.key, q.val, null);
if (tl == null)
hd = p;
else
tl.next = p;
tl = p;
}
return hd;
}
数组扩容; 暂时不看
/**
* Tries to presize table to accommodate the given number of elements.
*
* @param size number of elements (doesn't need to be perfectly accurate)
*/
// 数组扩大一倍
private final void tryPresize(int size) {
int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
tableSizeFor(size + (size >>> 1) + 1);
// 数组长度16扩容到32 ; 数组长度 32扩容到64
int sc;
while ((sc = sizeCtl) >= 0) {
Node<K,V>[] tab = table; int n;
if (tab == null || (n = tab.length) == 0) {
n = (sc > c) ? sc : c;
if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if (table == tab) {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = nt;
sc = n - (n >>> 2);
}
} finally {
sizeCtl = sc;
}
}
}
else if (c <= sc || n >= MAXIMUM_CAPACITY)
break;
else if (tab == table) {
int rs = resizeStamp(n);
if (sc < 0) {
Node<K,V>[] nt;
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
transfer(tab, null);
}
}
}
static final int MIN_TREEIFY_CAPACITY = 64;
数组长度至少64, 才会触发 链表转换成红黑树
sizeCtl的作用
// 默认是0 或者在构造方法中和cap大小相同;
private transient volatile int sizeCtl;
j.u.c ConcurrentHashMap addCount方法
1、当总节点数量超过sizeCtl则对数组执行扩容操作; 将数组长度扩大为原来的2倍;
2、记录当前总节点的数量;
当添加、修改 元素都会触发判断数组是否需要扩容的操作:
sizeCtl作为判断是否对数组进行2倍扩容的依据;
sizeCtl= loaderFactor*当前数组长度;
一般loaderFactor=3/4.
sizeCtl 在初始化数组或者做数组扩容的时候,用来乐观锁标记的;初始化数组结束之后、或者扩容结束之后, sizeCtl=0.75*数组长度; 当总节点数量大于sizeCtl,则触发对数组的扩容操作。
初始化数组
unsafe.compareAndSwapInt(当前对象, Unsafe.SIZECTL就是对sizeCtl字段的偏移量, 期待值, 新值替换sizeCtl中的旧值)
// Unsafe.SIZECTL就是对sizeCtl字段的偏移量
SIZECTL = U.objectFieldOffset(k.getDeclaredField("sizeCtl"));
/**
* Initializes table, using the size recorded in sizeCtl.
*/
private final Node<K,V>[] initTable() {
Node<K,V>[] tab; int sc;
while ((tab = table) == null || tab.length == 0) {//第一层判断, 数组是空的
if ((sc = sizeCtl) < 0) //第二层判断, 其他线程在操作数组
Thread.yield(); // lost initialization race; just spin; 放弃竞争, 等待其他线程完成。
// 否则, 加锁, 让其他线程放弃竞争。
//unsafe.compareAndSwapInt(当前对象, Unsafe.SIZECTL就是对sizeCtl字段的偏移量, 期待值, 新值替换sizeCtl中的旧值)这是个原子操作
else if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
// 第三层判断, 数组是空的。 这是为了数组都初始化完成了, 锁也放开了,又被其他线程初始化了一遍。或者根本就没有竞争, 直接初始化数组了。
if ((tab = table) == null || tab.length == 0) {
int n = (sc > 0) ? sc : DEFAULT_CAPACITY;
// 创建数组
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = tab = nt;
//第四步中0.75为四分之三,这里n - (n >>> 2)是不是刚好是n-(1/4)n=(3/4)n,
sc = n - (n >>> 2);
}
} finally {
// 5、 作用是为了让其他的线程跳出while循环
sizeCtl = sc;
}
break;
}
}
return tab;
}
乐观锁代码部分
// Unsafe mechanics
private static final sun.misc.Unsafe U;
// 乐观锁, 通过这个控制数组这个共享变量的读写在多线程环境中的一致性。
private static final long SIZECTL;
private static final long TRANSFERINDEX;
private static final long BASECOUNT;
private static final long CELLSBUSY;
private static final long CELLVALUE;
private static final long ABASE;
private static final int ASHIFT;
static {
try {
U = sun.misc.Unsafe.getUnsafe();
Class<?> k = ConcurrentHashMap.class;
SIZECTL = U.objectFieldOffset
(k.getDeclaredField("sizeCtl"));
TRANSFERINDEX = U.objectFieldOffset
(k.getDeclaredField("transferIndex"));
BASECOUNT = U.objectFieldOffset
(k.getDeclaredField("baseCount"));
CELLSBUSY = U.objectFieldOffset
(k.getDeclaredField("cellsBusy"));
Class<?> ck = CounterCell.class;
CELLVALUE = U.objectFieldOffset
(ck.getDeclaredField("value"));
Class<?> ak = Node[].class;
ABASE = U.arrayBaseOffset(ak);
int scale = U.arrayIndexScale(ak);
if ((scale & (scale - 1)) != 0)
throw new Error("data type scale not a power of two");
ASHIFT = 31 - Integer.numberOfLeadingZeros(scale);
} catch (Exception e) {
throw new Error(e);
}
}
tableAt方法
// 这边为什么i要等于((long)i << ASHIFT) + ABASE呢,计算偏移量
static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
// Key对应的数组元素的可见性,由Unsafe的getObjectVolatile方法保证。
//((long)i << ASHIFT) + ABASE就算i最后的地址
return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}
*这边为什么i要等于((long)i << ASHIFT) + ABASE呢,计算偏移量
*ASHIFT是指tab[i]中第i个元素在相对于数组第一个元素的偏移量,而ABASE就算第一数组的内存素的偏移地址
*所以呢,((long)i << ASHIFT) + ABASE就算i最后的地址
Unsafe对数组操控
这部分主要介绍与数据操作相关的arrayBaseOffset与arrayIndexScale这两个方法,两者配合起来使用,即可定位数组中每个元素在内存中的位置。
//返回数组中第一个元素的偏移地址
public native int arrayBaseOffset(Class<?> arrayClass);
//返回数组中一个元素占用的大小
public native int arrayIndexScale(Class<?> arrayClass);
为什么数组长度都是2的幂次方呢?
*但是这边为什么i要等于((long)i << ASHIFT) + ABASE呢,计算偏移量
*((long)i << ASHIFT)是指tab[i]中第i个元素在相对于数组第一个元素的偏移量,而ABASE就算第一数组的内存素的偏移地址
*所以呢,((long)i << ASHIFT) + ABASE就算i最后的地址
Class<?> ak = Node[].class;
ABASE = U.arrayBaseOffset(ak);
int scale = U.arrayIndexScale(ak); // 到底表示什么暂时无解
// 下面这段代码暂时无解, 不能理解
if ((scale & (scale - 1)) != 0)
throw new Error("data type scale not a power of two");
ASHIFT = 31 - Integer.numberOfLeadingZeros(scale);
有些问题暂时是无解的, 先搞定能搞定的
节点类型
ForwardingNode 链表第一个
ReservationNode 保留节点
A place-holder node used in computeIfAbsent and compute
Node 普通节点
helpTransfer 数组扩容代码, 在看扩容代码之前, 先看链表/红黑树插入新节点。
/**
* Helps transfer if a resize is in progress.
*/
final Node<K,V>[] helpTransfer(Node<K,V>[] tab, Node<K,V> f) {
Node<K,V>[] nextTab; int sc;
if (tab != null && (f instanceof ForwardingNode) &&
(nextTab = ((ForwardingNode<K,V>)f).nextTable) != null) {
int rs = resizeStamp(tab.length);
while (nextTab == nextTable && table == tab &&
(sc = sizeCtl) < 0) {
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1)) {
transfer(tab, nextTab);
break;
}
}
return nextTab;
}
return table;
}
负载因子
// load_factor table的负载因子,当前节点数量超过 n * LOAD_FACTOR,执行扩容
// 位操作表达式为 n - (n >>> 2), n是节点数量
private static final float LOAD_FACTOR = 0.75f
putALL
public void putAll(Map<? extends K, ? extends V> m) {
tryPresize(m.size());
for (Map.Entry<? extends K, ? extends V> e : m.entrySet())
putVal(e.getKey(), e.getValue(), false);
}
数组扩容源码分析
// size参数
if ((n = tab.length) < MIN_TREEIFY_CAPACITY)
tryPresize(n << 1); // 扩容2倍
private final void tryPresize(int size) {
// 计算扩容后的数组长度
int c = (size >= (MAXIMUM_CAPACITY >>> 1)) ? MAXIMUM_CAPACITY :
tableSizeFor(size + (size >>> 1) + 1);
int sc;
while ((sc = sizeCtl) >= 0) { // sizeCtl 当前数组长度的0.75
Node<K,V>[] tab = table; // 旧的数组
int n;
if (tab == null || (n = tab.length) == 0) { // 如果旧的数组为空或者长度为0,则执行初始化操作,初始化操作和initTable方法初始化数组的代码一样。
n = (sc > c) ? sc : c;
if (U.compareAndSwapInt(this, SIZECTL, sc, -1)) {
try {
if (table == tab) {
@SuppressWarnings("unchecked")
Node<K,V>[] nt = (Node<K,V>[])new Node<?,?>[n];
table = nt;
sc = n - (n >>> 2);
}
} finally {
sizeCtl = sc;
}
}
}
else if (c <= sc || n >= MAXIMUM_CAPACITY) // 如果扩容后的数组长度不大于sizeCtl(当前数组的0.75, 或者当前的数组长度已经达到了最大限制,则不再扩容。
break;
else if (tab == table) { // 旧的数组没变
int rs = resizeStamp(n);
if (sc < 0) {
Node<K,V>[] nt;
if ((sc >>> RESIZE_STAMP_SHIFT) != rs || sc == rs + 1 ||
sc == rs + MAX_RESIZERS || (nt = nextTable) == null ||
transferIndex <= 0)
break;
if (U.compareAndSwapInt(this, SIZECTL, sc, sc + 1))
transfer(tab, nt);
}
else if (U.compareAndSwapInt(this, SIZECTL, sc,
(rs << RESIZE_STAMP_SHIFT) + 2))
transfer(tab, null);
}
}
}
邮戳
static final int resizeStamp(int n) {
//Must be at least 6 for 32bit arrays.
private static int RESIZE_STAMP_BITS = 16;
// 求出n的二进制,32位, 第一个位是1的, 之前有多少个0
// 位或, 用来记录n的二进制前面位是0的总数。
return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}
数组单元 红黑树结构退化成 链表结构
static final int UNTREEIFY_THRESHOLD = 6;
当红黑树节点数<=6则退化成链表。
/**
* Returns a list on non-TreeNodes replacing those in given list.
*/
// 这个方法用来将红黑树退化成链表
static <K,V> Node<K,V> untreeify(Node<K,V> b) {
Node<K,V> hd = null, tl = null;
for (Node<K,V> q = b; q != null; q = q.next) {
Node<K,V> p = new Node<K,V>(q.hash, q.key, q.val, null);
if (tl == null)
hd = p;
else
tl.next = p;
tl = p;
}
return hd;
}