一、简介
ThreadLocal提供了线程本地变量,通过get或者set操作的这些变量在每个不同线程间是不相同的,各个线程独立地初始化这些变量。ThreadLocal实例通常在类中是声明为private static域的,用于在同一个线程内关联相同的状态(e.g. 一个User ID或者Transaction ID)。ThreadLocal相当于提供了一种线程隔离,将变量与线程相绑定。
只要线程还存活并且ThreadLocal实例还能被获取到,那么每个线程会持有一个ThreadLocal变量弱引用。当线程结束生命周期时,所有的线程本地实例都会被GC。
二、简单示例
/**
* 不同线程持有一个不同的UUID
*/
public class ThreadLocalTest {
private static ThreadLocal<String> uuidLocal = new ThreadLocal<String>(){
protected String initialValue() {
return UUID.randomUUID().toString();
}
};
public static void main(String[] args) {
UUIDThread t1 = new UUIDThread();
UUIDThread t2 = new UUIDThread();
t1.start();
t2.start();
}
public static class UUIDThread extends Thread {
@Override
public void run() {
System.out.println(Thread.currentThread().getName() + " uuid: " + uuidLocal.get());
}
}
}
输出结果两个uuid不同,如下所示:
Thread-1 uuid: d8d2006f-0a8a-4999-90c0-de2648c742da
Thread-0 uuid: 5061e4bd-8f57-4ef6-8b74-e7571f9efb93
三、我司的用法
使用用户公司来做分库,不同的公司数据分在不同的业务库中,将companyID存入DataSourceContext中,查询数据库的时候从DataSourceContext获取对应的companyID,根据companyID获取对应的数据库链接。
public class DataSourceContext {
static final ThreadLocal<String> local = new ThreadLocal<>();
public DataSourceContext() {
}
public static String getCompany() {
return local.get();
}
public static String setCompany(String companyID) {
return companyID == null ? null : set(companyID);
}
}
四、成员变量
private final int threadLocalHashCode = nextHashCode(); // 初始值为0
private static AtomicInteger nextHashCode =
new AtomicInteger();
private static final int HASH_INCREMENT = 0x61c88647;
private static int nextHashCode() {
return nextHashCode.getAndAdd(HASH_INCREMENT);
}
ThreadLocal通过自定义threadLocalHashCode来减少线性探测的冲突,每次实例化一个ThreadLocal,threadLocalHashCode都会新增HASH_INCREMENT(0x61c88647)。
五、几个方法
1. initialValue方法
/**
* 返回当前线程的线程本地变量初始化值,在一个线程首次调用get方法时被调用。
* 如果调用get之前调用了set方法,就不会调用initialValue方法了。
* 默认实现返回null,如果有需要,可以继承ThreadLocal,并覆盖该方法。
* 一般是使用匿名内部类的形式子类化。
*/
protected T initialValue() {
return null;
}
2. get方法
/**
* 返回当前线程的线程本地变量
*/
public T get() {
// 获取当前线程的引用
Thread t = Thread.currentThread();
// 从当前线程中获取到关联的ThreadLocalMap
ThreadLocalMap map = getMap(t);
if (map != null) {
ThreadLocalMap.Entry e = map.getEntry(this);
if (e != null)
return (T)e.value;
}
// 如果当前线程没有线程本地变量,就设置初始值
return setInitialValue();
}
/**
* 从ThreadLocal中获取一个关联的Map
*/
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
可以从代码中看出来,get()方法就是从当前线程中获取一个和当前线程相关联的ThreadLocalMap,然后以this为key,从ThreadLocalMap中取出相应的值,并返回。如果没有值,就设置一个初始值。
/* ThreadLocal values pertaining to this thread. This map is maintained
* by the ThreadLocal class. */
ThreadLocal.ThreadLocalMap threadLocals = null;
threadLocals是Thread的成员变量,每个线程通过ThreadLocal.ThreadLocalMap与ThreadLocal相绑定,这样可以确保每个线程访问到的thread-local variable都是本线程的。
3. set方法
/**
* 设置初始值
*/
private T setInitialValue() {
T value = initialValue();
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
// 如果线程t不存在ThreadLocalMap实例,就创建一个
createMap(t, value);
return value;
}
/**
* 实例化一个ThreadLocalMap并赋值给t.threadLocals
*/
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
/**
* 设置当前线程的线程本地变量值
*/
public void set(T value) {
Thread t = Thread.currentThread();
ThreadLocalMap map = getMap(t);
if (map != null)
map.set(this, value);
else
createMap(t, value);
}
可以看出set()方法和setInitialValue()方法类似,如果当前线程存在threadLocals,那么直接把设置的值put到这个ThreadLocalMap中。否则,创建一个带有这个value的ThreadLocalMap。
4. remove方法
public void remove() {
ThreadLocalMap m = getMap(Thread.currentThread());
if (m != null)
m.remove(this);
}
首先获取当前线程,并从当前线程中获取ThreadLocalMap,如果不为空,则调用ThreadLocalMap的remove方法,把以this为key的Entry移除掉。如果随后在当前线程中被调用了get方法,那么因为原先的Entry已经被移除掉了,所以还会调用一次initialValue()方法初始化值。
5. 小结
从这些方法可以看出ThreadLocal类的设计,Thread中有ThreadLocalMap成员变量,ThreadLocalMap又以ThreadLocal作为key来存放值。也就是说ThreadLocal把自身实例作为key,和需要保存的value存放到当前线程的一个Map中,来保证每个线程访问到的线程本地变量值都是各自线程的。ThreadLocal#set方法可以简单理解为Thread.currentThread().threadLocals.put(this, value),ThreadLocal#get方法可以简单理解为Thread.currentThread().threadLocals.get(this)。
六、ThreadLocalMap
ThreadLocal实现中,核心还是ThreadLocalMap。ThreadLocal只是作为ThreadLocalMap的key, 从ThreadLocalMap中获取到相应的值。下面简单看下ThreadLocalMap的实现。
1. 成员变量
/**
* 初始容量,必须是2^n
*/
private static final int INITIAL_CAPACITY = 16;
/**
* 必要时会扩容,但必须是2^n
*/
private Entry[] table;
/**
* table中entry的数量,也就是ThreadLocalMap的大小
*/
private int size = 0;
/**
* 下一次扩容的阈值
*/
private int threshold; // Default to 0
其中INITIAL_CAPACITY代表这个ThreadLocalMap的初始容量;table是一个Entry类型的数组,用于存储数据;size代表表中的存储数目,也就是ThreadLocalMap的大小;threshold代表需要扩容时对应size的阈值。
2. 静态内部类
static class Entry extends WeakReference<ThreadLocal> {
/** The value associated with this ThreadLocal. */
Object value;
Entry(ThreadLocal k, Object v) {
super(k);
value = v;
}
}
Entry继承了WeakReference,当除了Entry以外没有其它地方强引用ThreadLocal实例,那么ThreadLocal实例就会被GC回收,避免造成内存溢出。
3. 构造函数
ThreadLocalMap(ThreadLocal firstKey, Object firstValue) {
table = new Entry[INITIAL_CAPACITY];
// 对hashcode“取模”计算出table中索引值
int i = firstKey.threadLocalHashCode & (INITIAL_CAPACITY - 1);
table[i] = new Entry(firstKey, firstValue);
size = 1;
setThreshold(INITIAL_CAPACITY);
}
计算索引值i的时候里面采用了hashCode & (size - 1)的算法,这相当于取模运算hashCode % size的一个更高效的实现(和HashMap中的思路相同)。正是因为这种算法,要求size必须是2^n。
4. set方法
大致思路为:
- 通过
key的hashcode计算出索引值 - 从索引值
i开始,通过线性探测法从table中找到一个可以存放value的地方,然后设置值 - 因为
ThreadLocalMap的key是WeakReference,所以会存在Entry存在,但是key已经被回收的情况,这时候需要进行一些清理工作,把这些Entry清理掉。 - 如果
size大于阈值(threshold),就要进行扩容,并rehash,从新计算映射。
private void set(ThreadLocal key, Object value) {
Entry[] tab = table;
int len = tab.length;
// 计算索引值
int i = key.threadLocalHashCode & (len-1);
// 使用线性探测法来解决冲突,而不是HashMap中采用的拉链法
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
ThreadLocal k = e.get();
// 如果欲设置的key和table[i]中的相同,则更新value
if (k == key) {
e.value = value;
return;
}
// 如果k==null,证明key(WeakReference)已经被GC回收,所以替换新的key和value
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}
// 创建新的Entry
tab[i] = new Entry(key, value);
int sz = ++size;
// 如果更新之后的size大于阈值threshold,则需要rehash
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
/** 线性探测法的套路,找到下一个索引,如果越界了,就从0开始 */
private static int nextIndex(int i, int len) {
return ((i + 1 < len) ? i + 1 : 0);
}
5. getEntry方法
ThreadLocal#get方法就是调用了ThreadLocalMap#getEntry方法。
大致思路为:
- 通过
key的hashcode计算出索引值i - 为了提高性能,直接判断索引值下的
Entry是不是需要找的 - 否则,用线性探测的方式找到相应的
value
private Entry getEntry(ThreadLocal key) {
// 计算出索引值
int i = key.threadLocalHashCode & (table.length - 1);
Entry e = table[i];
// 命中,则直接返回
if (e != null && e.get() == key)
return e;
else
// 按线性探测的方式查找
return getEntryAfterMiss(key, i, e);
}
/**
* 和getEntry类似,用于当key的hash直接计算出的索引值上找不到Entry时
*/
private Entry getEntryAfterMiss(ThreadLocal key, int i, Entry e) {
Entry[] tab = table;
int len = tab.length;
while (e != null) {
ThreadLocal k = e.get();
if (k == key)
return e;
if (k == null)
// 清理过期的Entry
expungeStaleEntry(i);
else
i = nextIndex(i, len);
e = tab[i];
}
return null;
}
6. remove方法
remove方法和getEntry方法类似,计算索引值i,用线性探测的防止,找到Entry后,清理Entry。
private void remove(ThreadLocal key) {
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
if (e.get() == key) {
e.clear();
expungeStaleEntry(i);
return;
}
}
}
7. 扩容方法
扩容方法也很清楚,判断目前使用的容量是否大于一定的值(size >= 3 / 4 * threshold),如果大于,则需要resize。
resize方法的思路如下:
-
size扩大为两倍,创建一个新的table表,将oldTab上的Entry转移到newTab上。 - 转移过程中,如果发现
e.get() == null,则证明key已经被GC回收,那么这个Entry就不转移。 - 否则,用线性探测法找到
Entry在newTab存放的位置,并设置。 - 最后设置新的
threshold。
可以看出threshold的大小为len * 2 / 3,所以每次size >= 0.5 * len的时候就要进行扩容(resize)。
private void rehash() {
expungeStaleEntries();
// 如果size > 3/4 * threshold,则扩容
if (size >= threshold - threshold / 4)
resize();
}
/**
* table容量翻倍
*/
private void resize() {
Entry[] oldTab = table;
int oldLen = oldTab.length;
int newLen = oldLen * 2;
Entry[] newTab = new Entry[newLen];
int count = 0;
for (int j = 0; j < oldLen; ++j) {
Entry e = oldTab[j];
if (e != null) {
ThreadLocal k = e.get();
// 如果k已经被GC回收,那么把value也设置为null,帮助GC回收,防止内存泄漏
if (k == null) {
e.value = null; // Help the GC
} else {
// 从新计算索引值,并通过线性探测的方式存放到table中
int h = k.threadLocalHashCode & (newLen - 1);
while (newTab[h] != null)
h = nextIndex(h, newLen);
newTab[h] = e;
count++;
}
}
}
setThreshold(newLen);
size = count;
table = newTab;
}
private void setThreshold(int len) {
threshold = len * 2 / 3;
}
8. 一些清理方法
1) expungeStaleEntry
首先会清理tab[staleSlot]上过期的Entry,然后需要再散列(rehash),中间可能还会遇到一些过期的Entry,这些也要清理掉,知道遇到table[i] == null,中间的所有Entry都要rehash。
private int expungeStaleEntry(int staleSlot) {
Entry[] tab = table;
int len = tab.length;
// 清理掉过期位置的Entry
tab[staleSlot].value = null;
tab[staleSlot] = null;
size--;
// 再散列,知道遇到table[i] == null
Entry e;
int i;
for (i = nextIndex(staleSlot, len);
(e = tab[i]) != null;
i = nextIndex(i, len)) {
ThreadLocal k = e.get();
if (k == null) {
e.value = null;
tab[i] = null;
size--;
} else {
int h = k.threadLocalHashCode & (len - 1);
// 如果h==i,那么证明这个Entry就是要放在table[i]上的,就不要rehash这个Entry
// 否则,rehash
if (h != i) {
// 先把当前位置tab[i]释放出来,再把Entry放到新的位置
tab[i] = null;
// Unlike Knuth 6.4 Algorithm R, we must scan until
// null because multiple entries could have been stale.
while (tab[h] != null)
h = nextIndex(h, len);
tab[h] = e;
}
}
}
return i;
}
2) cleanSomeSlots
/**
* 探索式扫描寻找过期的entry,当增加新元素或者另一个过期entry被清理的时候会被调用
*/
private boolean cleanSomeSlots(int i, int n) {
boolean removed = false;
Entry[] tab = table;
int len = tab.length;
do {
i = nextIndex(i, len);
Entry e = tab[i];
// 判断是否过期,如果是则处理
if (e != null && e.get() == null) {
n = len;
removed = true;
i = expungeStaleEntry(i);
}
} while ( (n >>>= 1) != 0);
return removed;
}
每次新增元素的时候会进行探索式扫描,寻找过期Entry并清理。
3) 何时会清理过期Entry
处理Thread实例被GC回收,ThreadLocalMap同时被回收之外,下面这些条件下,会清理过期的Entry。
-
getEntry时,线性探索寻找Entry的时候发现Entry过期。 -
set的时候发现,key对应索引值的Entry已过期,则会清理并替换 - 每次调用
set方法的时候,会探索式扫描Entry,如果发现过期,则清理。 -
size > threshold,rehash的时候。 - 调用
remove方法的时候。
当前的应用开发过程中,出于复用的目的,常常会使用线程池的技术,线程中ThreadLocalMap可能会长期存在。因为Entry中的key被WeakReference包装,在key不存在强引用的时候,会回收key,但是Entry和value并不会被回收。所以在ThreadLocalMap中需要不时地清理过期的Entry,来保证内存不泄露。当然,如果我们在代码中每次使用完ThreadLocal,都可以remove一下,那么就可以尽早释放不需要的内存。