并发五：透过源码彻底理解ThreadLocal

ThreadLocal

经常会在资料上看到对ThreadLocal的描述：

"是一个变量的本地副本，为每一个线程提供一个变量副本，互相不影响"
"避免了共享变量的冲突"
"解决多线程的并发访问的一种方式"

个人觉得这样的描述很具有迷惑性，"副本"那主本是什么?它根本就不是解决"并发访问"问题的好吧,ThreadLocal中的变量根本就没有共享,哪来的"并发访问"?

更确切的定义:

ThreadLocal是线程执行时的上下文,用于存放线程局部变量。

ThreadLocal 涉及的三个类：

ThreadLocalMap 是存放局部变量的容器
Thread中通过变量ThreadLocal.ThreadLocalMap threadLocals来持有ThreadLocalMap的实例
ThreadLocal则是ThreadLocalMap的manager，控制着ThreadLocalMap的创建、存取、删除等工作。

ThreadLocalMap

ThreadLocalMap和Map接口没有关系，它是使用数组来存储变量的：private Entry[] table,table的初始容量是16，当table的实际长度大于容量时进行成倍扩容，所以table的容量始终是2的幂。

Entry

Entry使用ThreadLocal对象作为键，注意不是使用线程(Thread)对象作为键。

WeakReference表示一个对象的弱引用，java将对象的引用按照强弱等级分为四种：

强引用："Person p = new Person()"代表一个强引用，只要p存在，GC不会回收Person对象。
软引用：SoftReference代表一个软引用，在内存不足将要发生内存溢出时，GC会回收软引用对象。
弱引用：WeakReference代表一个弱引用，其生命周期在下次垃圾回收之前，不管内存足不足，都会被GC回收。
虚引用：PhantomReference代表一个虚引用，无法通过虚引用获取引用对象的值，也被称为"幽灵引用"，它的意义就是检查对象是否被回收。

关于弱引用的一个小栗子:

import java.lang.ref.WeakReference;
public class WeakReferenceTest {
    public static void main(String[] args) {
        Object o = new Object();
        WeakReference<Object> wof = new WeakReference<Object>(new Object());
        System.out.println(wof.get()==null);//false
        System.out.println(o==null);//false
        System.gc();// 通知系统GC
        System.out.println(wof.get()==null);//true
        System.out.println(o==null);//false
    }
}

Entry定义成弱引用的目的是确保没有了ThreadLocal对象的强引用时，能释放ThreadLocalMap中的变量内存。

// 定义ThreadLocal
public static final ThreadLocal<Session> sessions = new ThreadLocal<Session>();
在某个时刻：
sessions = null;
说明已不使用sessions了，应该释放ThreadLocalMap中的变量内存。

因为ThreadLocalMap是隐藏在内部的，程序员不可见，所以必须要有一个机制能释放ThreadLocalMap对象中的变量内存。

存入

逻辑：

s1:从当前线程中拿出ThreadLocalMap,如果为空进行创建create，不为空进行值存入转入s2
s2:使用ThreadLocal实例作为key和value调用ThreadLocalMap的set方法
s3:使用ThreadLocal实例的threadLocalHashCode与table的容量取模，计算值要放入table中的坐标
s4:使用这个坐标线性向后探测table，如果发现相同的key则更新值，返回。如果发现实现的key(ThreadLocal实例被GC回收,因为它是WeakReference，所以key为空)，转入s5,未发现相同的key和实现的key，转入s6
s5:调用replaceStaleEntry方法清理talbe中key失效的entry，在清理过程中发现相同的key进行值更新，否则新建Entry插入table(坐标为staleSlot)，返回。
s6:新建一个Entry插入talbe(坐标为i)，使用i和自增后的长度sz调用cleanSomeSlots做table的连续段清理，转入s7
s7:清理之后发现table长度大于等于扩容阈值threshold，进行table扩容

源码：

public void set(T value) {
    Thread t = Thread.currentThread();
    // getMap(t):t.threadLocals,s1 从当前线程中拿出ThreadLocalMap
    ThreadLocalMap map = getMap(t);
    if (map != null)// map 不为空set
        map.set(this, value);  // s2 ThreadLocal的实例(this)作为key
    else // map为空create
        createMap(t, value);
}
private void set(ThreadLocal key, Object value) {
    Entry[] tab = table;
    int len = tab.length;
    int i = key.threadLocalHashCode & (len-1);// s3 hash计算出table坐标
    // 线性探测
    for (Entry e = tab[i];e != null;e = tab[i = nextIndex(i, len)]) {
    ThreadLocal k = e.get();
    // 找到对应的entry
    if (k == key) {
        e.value = value;// 更新值
        return;
    }
    // 替换失效的entry   
    if (k == null) {
        replaceStaleEntry(key, value, i);//清理
        return;
    }
    }
    tab[i] = new Entry(key, value);// 插入新值
    int sz = ++size; // 长度增加
    // table连续清理，并判断是否扩容
    if (!cleanSomeSlots(i, sz) && sz >= threshold)
        rehash();// 扩容table，并重新hash
}

扩容

逻辑：

s1:进行一次全量的清理(清理对应ThreadLocal已经被GC回收的entry)
s2:因为进行了一次清理，所以talbe的长度会变小，改变扩容的阈值，由原来的2/3改为1/2，如果table长度大于等于阈值，扩容转入s3
s3:新建一个数组，容量是table容量的2倍，数组拷贝,首先使用hash算法生成entry在新数组中的坐标，如果发生碰撞，使用线性探测重新确定坐标

代码：

private void rehash() {
    expungeStaleEntries();  // s1 做一次全量清理
    // s2 size很可能会变小调低阈值来判断是否需要扩容
    if (size >= threshold - threshold / 4)
    resize();// 扩容
}
private void resize() { // s3
    Entry[] oldTab = table;
    int oldLen = oldTab.length;// 原来的容量
    int newLen = oldLen * 2; // 扩容两倍
    Entry[] newTab = new Entry[newLen];// 新数组
    int count = 0;
    for (int j = 0; j < oldLen; ++j) {// 拷贝
    Entry e = oldTab[j];
    if (e != null) {
        ThreadLocal k = e.get();
        if (k == null) { // key失效，被回收
        e.value = null; // 帮助GC
        } else {
        // Hash获取元素的坐标
        int h = k.threadLocalHashCode & (newLen - 1);
        while (newTab[h] != null)
            h = nextIndex(h, newLen); // 线性探测 获取坐标
        newTab[h] = e;
        count++;
        }
    }
    }
    setThreshold(newLen);// 设置新的扩容阈值
    size = count;
    table = newTab;
}

魔数

HASH_INCREMENT = 0x61c88647这个数字和斐波那契散列有关(数学问题感兴趣可以深入研究)，通过这个数字可以得到均匀的散列码。

一个小栗子:

public class Hash {
    private static AtomicInteger nextHashCode = new AtomicInteger();
    private static final int HASH_INCREMENT = 0x61c88647;
    private static int nextHashCode() {
        return nextHashCode.getAndAdd(HASH_INCREMENT);
    }
    public static void main(String[] args) {
        int length = 32;
        for(int i=0;i<n;i++) {
            System.out.println(nextHashCode()&(length-1));
        }
    }
}

会发现生成的散列码非常均匀，如果把length改为31就会发现得到的散列码不那么均匀了。

length-1的二进制表示就是低位连续的N个1,nextHashCode()&(length-1)的值就是nextHashCode()的低N位, 这样就能均匀的产生均匀的分布,这是为什么ThreadLocalMap中talbe的容量必须为2的幂的原因。

取值

逻辑：

s1:从当前线程中拿出ThreadLocalMap,如果为空进行初始化设置setInitialValue，不为空，使用ThreadLocal实例作为key从ThreadLocalMap中取值，转入s2
s2:使用hash算法生成key对应entry在table中的坐标i,如果table[i]对应的entry不为空且key未失效，说明命中直接返回，否则转入s3
s3:线性探测table,如果发现相同的key，返回。如果发现失效的key，调用expungeStaleEntry清理talbe,探测完毕返回null

源码：

public T get() {
    Thread t = Thread.currentThread();// 当前线程
    ThreadLocalMap map = getMap(t);// 拿出ThreadLocalMap
    if (map != null) { // s1 ThreadLocalMap不为空
        ThreadLocalMap.Entry e = map.getEntry(this);
        if (e != null)
        return (T)e.value;
    }
    return setInitialValue();// ThreadLocalMap为空
}
private Entry getEntry(ThreadLocal key) {
    int i = key.threadLocalHashCode & (table.length - 1); // hash坐标
    Entry e = table[i];
    if (e != null && e.get() == key) // s2  key有效，命中返回
    return e;
    else
    return getEntryAfterMiss(key, i, e); // 线性探测，继续查找
}
private Entry getEntryAfterMiss(ThreadLocal key, int i, Entry e) { // s3
    Entry[] tab = table;
    int len = tab.length;
    while (e != null) {
        ThreadLocal k = e.get();
        if (k == key) // 找到目标
            return e;
        if (k == null) // entry对应的ThreadLocal已经被回收，清理无效entry
            expungeStaleEntry(i);
        else
            i = nextIndex(i, len); // 往后走
        e = tab[i];
    }
    return null;
}

删除

源码：

public void remove() {
     ThreadLocalMap m = getMap(Thread.currentThread());// 从当前线程拿出ThreadLocalMap
     if (m != null)
          m.remove(this);// 删除，key为ThreadLocal实例
}
private void remove(ThreadLocal key) {
     Entry[] tab = table;
     int len = tab.length;
     int i = key.threadLocalHashCode & (len-1);// hash定位
     for (Entry e = tab[i];
          e != null;
          e = tab[i = nextIndex(i, len)]) {
          if (e.get() == key) {
               e.clear();// 断开弱引用
               expungeStaleEntry(i);// 从i开始，进行段清理
               return;
          }
      }
}

内存泄露

通过上文可以看到ThreadLocal为应对内存泄露做的工作：

将Entry定义成弱引用，如果ThreadLocal实例不存在强引用了那么Entry的key就会失效
get()、set()方法都进行失效key的清理

即便是这样也不能保证万无一失：

通常情况下为了使线程可以共用ThreadLocal，会这样定义：static final ThreadLocal threadLocal,这样static变量的生命周期是随class一起的，所以它永远不会被GC回收，这个强引用在key就不会失效。
不使用static定义threadLocal，由于有一条强引用链：Thread Ref -> Thread -> ThreaLocalMap -> Entry -> value的存在，在长生命周期的线程中(比如线程池)也有内存泄露的风险。短生命周期的线程则无所谓，因为随着线程生命周期的结束，一切都烟消云散。

当然这并不可怕，只要在使用完threadLocal后调用下remove()方法，清除数据，就可以了。

小结
1：ThreadLocal是线程执行时的上下文,用于存放线程局部变量。它不能解决并发情况下数据共享的问题
2：ThreadLocal是以ThreadLocal对象本身作为key的，不是线程(Thread)对象
3：ThreadLocal存在内存泄露的风险，要养成用完即删的习惯
4：ThreadLocal使用散列定位数据存储坐标，如果发生碰撞，使用线性探测重新定位，这在高并发场景下会影响一点性能。改善方法如netty的FastThreadLocal，使用固定坐标，以空间换时间，后面会分析FastThreadLocal实现。

码字不易，转载请保留原文连接https://www.jianshu.com/p/0e7bca4f50fb

最后编辑于：2021.04.28 11:26:50

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 158,847评论 4赞 362
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,208评论 1赞 292
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,587评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,942评论 0赞 205
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,332评论 3赞 287
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,587评论 1赞 218
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,853评论 2赞 312
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,568评论 0赞 198
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,273评论 1赞 242
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,542评论 2赞 246
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,033评论 1赞 260
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,373评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 33,031评论 3赞 236
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,073评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,830评论 0赞 195
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,628评论 2赞 274
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,537评论 2赞 269

并发五： 透过源码彻底理解ThreadLocal

ThreadLocal

ThreadLocalMap

推荐阅读更多精彩内容

并发五：透过源码彻底理解ThreadLocal