是什么
多线程既然可以操作共享资源,那也会有线程之间资源隔离的需求——每个线程只能访问自己的数据不能访问别的线程中的数据。Synchronized用于多线程间的数据共享,而ThreadLocal则用于线程间的数据隔离,通过ThreadLocal在同一线程不同组件中传递公共变量。
前置知识
java中的4种引用。可以参考之前发布的文章:https://www.jianshu.com/p/2afd19d63171
ThreadLocal是什么
假设一种场景:在方法里面经过多次深层次的调用以后,我想要拿到方法中的一个参数,怎么办?
方法1:每次调用的参数中都带上它
这个方法实现起来很简单,但是有一个问题,如果我的多次调用中包含第三方库中的方法,无法修改入参怎么办?显然这个方法不是最好的方法。
方法2:直接把变量定义成static,全局都可以调用
这个方法解决了方法1的问题,但是又引来了新的问题:多线程访问这个变量的时候是不安全的。
方法3:使用ThreadLocal存储这个变量
为了解决线程不安全问题,就可以使用ThreadLocal来存储这个变量。ThreadLocal会为每个使用该变量的线程提供单独的变量副本,所以每个线程都可以独立地改变自己的变量副本,不要担心影响其他线程对应的副本或被其他线程影响。
原理
先用简单代码演示一下ThreadLocal的使用
static ThreadLocal<String> threadLocal = new ThreadLocal<>();
public static void main(String[] args) {
System.out.println("start");
new Thread(() -> {
threadLocal.set("thread1");
System.out.println("thread1:" + threadLocal.get());
}).start();
new Thread(() -> {
try {
TimeUnit.SECONDS.sleep(1);
} catch (InterruptedException e) {
e.printStackTrace();
}
System.out.println("thread2:" + threadLocal.get());
}).start();
}
运行结果
start
thread1:thread1
thread2:null
开启两个线程t1与t1,t1对ThreadLocal进行了set,然后两个线程分别对ThreadLocal进行打印。t1打印出了set的值,但是t2却是null。明明两个线程调用的变量是同一个变量,为什么结果不同,因为ThreadLocal对线程进行了隔离。
接下来我们来看看ThreadLocal的set方法的源码,看下到底是如何实现的。
public void set(T value) {
Thread t = Thread.currentThread(); //获取当前线程
ThreadLocalMap map = getMap(t); //获取当前线程的ThreadLocalMap
if (map != null)
map.set(this, value); //赋值ThreadLocalMap(ThreadLocal,value)
else
createMap(t, value); /创建当前线程的ThreadLocalMap
}
ThreadLocalMap getMap(Thread t) {
return t.threadLocals;
}
void createMap(Thread t, T firstValue) {
t.threadLocals = new ThreadLocalMap(this, firstValue);
}
private void set(ThreadLocal<?> key, Object value) {
// We don't use a fast path as with get() because it is at
// least as common to use set() to create new entries as
// it is to replace existing ones, in which case, a fast
// path would fail more often than not.
Entry[] tab = table;
int len = tab.length;
int i = key.threadLocalHashCode & (len-1);
for (Entry e = tab[i];
e != null;
e = tab[i = nextIndex(i, len)]) {
ThreadLocal<?> k = e.get();
if (k == key) {
e.value = value;
return;
}
if (k == null) {
replaceStaleEntry(key, value, i);
return;
}
}
tab[i] = new Entry(key, value);
int sz = ++size;
if (!cleanSomeSlots(i, sz) && sz >= threshold)
rehash();
}
整理一下过程:
1、获取当前线程
2、从当前线程中获取此线程的ThreadLocalMap
3、往ThreadLocalMap中塞入(ThreadLocal,value),塞值过程中将key和value组成一个Entry,继承了弱引用,防止ThreadLocal引用的对象内存泄露
下面用一张简图描述一下ThreadLocal的内部结构
[图片上传失败...(image-e0c32b-1676186004117)]
使用案例
除了上面提到的场景,也就是解决多层方法间数据传递的问题。在很多框架中都用到了ThreadLocal来解决一些问题,比如Spring中的事务管理器。我们都知道如果想要所有支持事务,那么这些方法必须拿到的是同一个数据库连接。为什么我们使用@Transactional注解标记某个方法支持事务的时候,方法里面调用了很多其他方法,它们都支持事务,那它们都是怎么拿到同一个数据库连接的呢?很简单,Spring把Connection放到了ThreadLocal中,只要是同一个线程随时都可以拿到,而且不会被其他线程影响,这样就可以保证被@Transactional注解标记的方法与其调用的其他方法都支持事务了。
ThreadLocal内存泄露问题
1、为什么ThreadLocalMap中的key是弱引用?
如果是强引用,即使线程对象被置为null,但是ThreadLocalMap的key的引用仍然指向ThreadLocal对象,GC时只会把线程对象回收,ThreadLocal由于被引用了不会被回收,就导致了内存泄露。
2、为什么ThreadLocal用完必须要进行remove?
由于ThreadLocalMap中的key是弱引用,而value是强引用。这就导致了ThreadLocal在没有外部对象强引用时,如果发生GC,key就会被回收,而value不会被回收,出现Entry中(null,value)的情况。如果线程一直持续运行,那么这个Entry对象中的value就不会得到回收,导致内存泄露。
注意:虽然get和set方法会把整个map中key为null的值全部清理,但是还是要remove,因为线程可能长时间不执行get方法。另外,如果线程来自线程池,ThreadLocal没有被清理掉,使用ThreadLocal的set方法后没有显式的调用remove方法,就有可能发生内存泄露。
总结
- 每个ThreadLocal只能保存一个变量副本,如果一个线程想要保存多个副本,就需要创建多个ThreadLocal
- ThreadLocal内部的ThreadLocalMap的key为弱引用,使用不当会有内存泄露的风险
- ThreadLocal适用于无状态,副本变量独立后不影响业务逻辑的高并发场景。如果业务逻辑强依赖于副本变量,则不适合使用ThreadLocal,需要另寻解决方案。