ConcurrentHashMap 原理和源码分析(一)

通过之前几篇文章《HashMap原理和源码分析》《HashTable原理和源码分析》《LinkedHashMap原理和源码分析》的理解和分析，终于引出来了重头戏ConcurrentHashMap的分析。

说实话，之前几个数据结构HashMap、HashTable 复杂度跟ConcurrentHashMap相比简直是小儿科。

少说废话，直接引入正题。

其实有个疑问，既然有了HashMap和HashTable，为什么会需要ConcurrentHashMap？

因为呢，HashMap是线程不安全的，而HashTable虽然是线程安全的，方法都是用Synchronized修饰的，但争夺的都是同一个对象锁，在高并发的情况下，会产生效率低，等待时间长的问题。这个时候，ConcurrentHashMap就荣耀登场了，至于为什么ConcurrentHashMap能解决高并发的情况？下面会详细解释。

ConcurrentHashMap的特性和原理

JDK1.8 跟之前的版本，ConcurrentHashMap的实现变化了很大。以下都是基于JDK1.8的源码和资料。

concurrentHashMap 不支持null的key和value
concurrentHashMap 很多地方使用了cas操作和分段加锁，加锁的最小单位是Hash桶，这使得ConcurrentHashMap效率大大提升。
数据结构：

数据结构描述

ConcurrentHashMap的数据结构跟HashMap一样：数组 + 链表 + 红黑树。当hash桶的节点数量超过8个，链表就会转化为红黑树，反之，节点数量减少到6就会转化链表

源码分析

1. 重要的常量

// 初始化容量
private static final int DEFAULT_CAPACITY = 16;

// 加载因子，跟hashmap一样
private static final float LOAD_FACTOR = 0.75f;

// 如果发现链表长度小于8，会从链表转化成树，跟hashmap一样
static final int TREEIFY_THRESHOLD = 8;

// 在哈希表扩容时，如果发现链表长度小于 6，则会由树变成链表，跟hashmap一样
static final int UNTREEIFY_THRESHOLD = 6;

// 最低树化的容量，如果 容量 < MIN_TREEIFY_CAPACITY 会发生一次resize()
static final int MIN_TREEIFY_CAPACITY = 64;

// 迁移桶的最低数量
// 表示扩容中，一个线程的一次任务负责迁移最少16个hash桶
// 后面结合代码再理解下
private static final int MIN_TRANSFER_STRIDE = 16;

// 用于生成每次扩容都唯一的生成戳的数
// 后面结合代码再理解下
private static final int RESIZE_STAMP_BITS = 16;

// 最大的扩容线程的数量
private static final int MAX_RESIZERS = (1 << (32 - RESIZE_STAMP_BITS)) - 1;

// 移位量
private static final int RESIZE_STAMP_SHIFT = 32 - RESIZE_STAMP_BITS;

// 以下是标记几个特殊的节点的hash值，都是负数
// ForwardingNode节点，表示该节点正在处于扩容工作，内部有个指针指向nextTable
static final int MOVED     = -1;

// 红黑树的首节点，内部不存key、value，只是用来表示红黑树
static final int TREEBIN   = -2; 

// ReservationNode保留节点，
// 当hash桶为空时，充当首结点占位符，用来加锁，在compute/computeIfAbsent使用
static final int RESERVED  = -3; 
 
// 用于普通节点hash计算
// 结合上面三个变量,特殊节点的hash值都是负数，普通节点为正数
static final int HASH_BITS = 0x7fffffff;

// CPU数量
static final int NCPU = Runtime.getRuntime().availableProcessors();

2. 后面常用到的方法：

// 计算hash值
// 让高16位 亦或 低16位，再把高的16位置为0
 static final int spread(int h) {
        // & HASH_BITS用于把hash值转化为正数
        return (h ^ (h >>> 16)) & HASH_BITS;
 }

// 跟hashmap扩容一样，计算出比c大，最小的2次幂的数，如14->16,29->32
private static final int tableSizeFor(int c) {
        int n = c - 1;
        n |= n >>> 1;
        n |= n >>> 2;
        n |= n >>> 4;
        n |= n >>> 8;
        n |= n >>> 16;
        return (n < 0) ? 1 : (n >= MAXIMUM_CAPACITY) ? MAXIMUM_CAPACITY : n + 1;
}

// 根据table的长度n生成一个戳，表示要扩容n长度的table，会构造出sizeCtl
// RESIZE_STAMP_BITS = 16
static final int resizeStamp(int n) {
    return Integer.numberOfLeadingZeros(n) | (1 << (RESIZE_STAMP_BITS - 1));
}

下面是CAS方法，CAS（compareAndSwap） 比较并交换，是无锁操作的重要手段，是一个原子操作

CAS(V, E, N)：如果变量V跟旧的预期值E相同，则修改成新值N，否则什么都不做

// 获取table[i] 得到hash桶首结点
static final <K,V> Node<K,V> tabAt(Node<K,V>[] tab, int i) {
   return (Node<K,V>)U.getObjectVolatile(tab, ((long)i << ASHIFT) + ABASE);
}

// 更新table[i]，Node链表 或者TreeBin
static final <K,V> boolean casTabAt(Node<K,V>[] tab, int i,  Node<K,V> c, Node<K,V> v) {
   return U.compareAndSwapObject(tab, ((long)i << ASHIFT) + ABASE, c, v);
}

// 修改table[i]
static final <K,V> void setTabAt(Node<K,V>[] tab, int i, Node<K,V> v) {
   U.putObjectVolatile(tab, ((long)i << ASHIFT) + ABASE, v);
}

3. 重要的变量

// 存储node节点的数组
transient volatile Node<K,V>[] table;

// 扩容后的新的table数组，只有在扩容时才有用
// nextTable != null，说明在进行扩容
private transient volatile Node<K,V>[] nextTable;

// 在初始化或resize时控制参数，重要，后面细说
private transient volatile int sizeCtl;

// 扩容下个表的索引，重要，后面细说
 private transient volatile int transferIndex;

// Node节点的数量，根据cas更新的，有可能不准确，需要结合counterCells一起计算
private transient volatile long baseCount;

// 操作counterCells的自旋锁
private transient volatile int cellsBusy;

// counterCell表，大小是2的幂数，
// 并行计算每个bucket的元素数量，结合baseCount算法出size，下面细说
private transient volatile CounterCell[] counterCells;

以上是理解ConcurrentHashMap非常重要的几个变量，其中有几个没有细说

sizeCtl

这个控制参数贯穿了初始化或扩容，而且不同状态下表达不同的含义。

sizeCtl == 0时候，默认情况
sizeCtl == -1 时候，说明table正在初始化
sizeCtl > 0 时候，说明接下来初始化要的初始化容量或者是扩容成功后threadshold的值
sizeCtl < 0 时候，说明正在扩容，而此刻的sizeCtl是怎么来的呢？

// 假如有一个线程，准备加入扩容，下面开始计算sizeCtl 
int rs = resizeStamp(table长度);
if (sizeCtl 未初始化 或准备初始化) { // sizeCtl >= 0
    sizeCtl =  (rs << RESIZE_STAMP_SHIFT) + 2 // RESIZE_STAMP_SHIFT = 16
} else { // sizeCtl < 0 ，正在扩容
    sizeCtl = rs + 1; //增加一个扩容的线程
}

rs << 16 左移16位，这样低16位都是0；
rs << 16 + 2 应该理解成 rs << 16 + 1 + 1，第一个1表示初始状态，第二个1表示目前有一个线程参与扩容。
sizeCtl分成了高16位，做验证使用，防止扩容重叠；低16位表示 n - 1个线程在参与扩容线程数

transferIndex

这个变量跟扩容迁移有关，原来table扩容新的nextTable，需要多个线程参与节点的迁移。

transferIndex 从 table.length开始，表示需要迁移的桶的数量或者可以说是索引。

每个线程每次进来，如果发现正在扩容并且 transferIndex > 0 的时候，会停止手头的工作，加入帮助扩容，从中分配得到一个 [trasferIndex - stride, transferIndex）区间对应的hash桶的迁移工作，transferIndex 慢慢的减少直至为0。

也有可能是同一个线程负责了多次任务，迁移了多个stride数量hash桶。

下面只是一个示意图，并不表示一次任务只能移动四个hash桶，并且stride的数量是根据CPU数量和tab的数量决定的，最小是MIN_TRANSFER_STRIDE（16）。

示意图

baseCount, cellBusy, counterCells 计数统计

这三个变量跟统计节点数量有关，

baseCount用于记录节点的个数
cellsBusy是一个只有0和1两个状态的volatile整数，它被当做一个自旋锁，0代表无锁，1代表加锁，只要对counterCells操作，都需要先CAS更新cellsBusy加锁
counterCells 是一个辅助baseCount计数的数组，每个counterCell存着部分的节点数量，这样做的目的就是尽可能地减少冲突，看完下面的流程就可以明白了。
table节点的数量 = baseCount + counterCells每个cell记录下来的节点数量

总体的原则就是：先尝试更新baseCount，失败再利用CounterCell

通过CAS尝试更新baseCount ，如果更新成功则完成，如果CAS更新失败会进入下一步；
线程通过随机数ThreadLocalRandom.getProbe() & (n-1) 计算出在counterCells数组的位置，如果不为null，则CAS尝试在couterCell上直接增加数量，如果失败会进入下一步；
counterCells数组会进行扩容为原来的两倍，继续随机，继续添加；
最后，table节点的数量 = baseCount + counterCells每个cell记录下来的节点数量

重要的内部类

// ConcurrentHashMap的节点
static class Node<K,V> implements Map.Entry<K,V> {
        final int hash;
        final K key;
        volatile V val;
        volatile Node<K,V> next;

    // 比较节点是否相同：value跟key都相同
    public final boolean equals(Object o) {
            Object k, v, u; Map.Entry<?,?> e;
            return ((o instanceof Map.Entry) &&
                    (k = (e = (Map.Entry<?,?>)o).getKey()) != null &&
                    (v = e.getValue()) != null &&
                    (k == key || k.equals(key)) &&
                    (v == (u = val) || v.equals(u)));
    }
}

//红黑树的根节点
 static final class TreeBin<K,V> extends Node<K,V> {
        TreeNode<K,V> root;
        volatile TreeNode<K,V> first;
        volatile Thread waiter;
        volatile int lockState；// 当前的锁状态
        static final int WRITER = 1; // 正在写
        static final int WAITER = 2; // 等待写
        static final int READER = 4; // 正在读
        ......
 }

// 红黑树的节点
static final class TreeNode<K,V> extends Node<K,V> {
        TreeNode<K,V> parent;  // red-black tree links
        TreeNode<K,V> left;
        TreeNode<K,V> right;
        TreeNode<K,V> prev;    // needed to unlink next upon deletion
        boolean red;
}

ForwardingNode

下面还有一个比较特别的节点

ForwardingNode 是临时节点，这个节点会出现在扩容的时候，不存储实际的数据数据。

如果Hash桶被迁移到新的table中，会在旧的table插入一个ForwardingNode临时节点，内部会指向新的table。

当读操作碰到ForwardingNode，会通过ForwardingNode内部的nextTable找到新的table，继续读。

当写操作碰到ForwadingNode，加入帮助扩容。

static final class ForwardingNode<K,V> extends Node<K,V> {
    final Node<K,V>[] nextTable;
    ForwardingNode(Node<K,V>[] tab) {
        super(MOVED, null, null, null); // hash设置为move，为-1
        this.nextTable = tab;
    }

    //重写了Node中的find方法
    Node<K,V> find(int h, Object k) {
        // 避免多次碰到ForwardingNode导致递归过深
        outer: for (Node<K,V>[] tab = nextTable;;) {
            Node<K,V> e; int n;
            if (k == null || tab == null || (n = tab.length) == 0 ||
                (e = tabAt(tab, (n - 1) & h)) == null)
                return null;
            for (;;) {
                int eh; K ek;
                if ((eh = e.hash) == h &&
                    ((ek = e.key) == k || (ek != null && k.equals(ek))))
                    return e;
                if (eh < 0) {
                    if (e instanceof ForwardingNode) {// 还碰到ForwardingNode，往下递归接着找
                        tab = ((ForwardingNode<K,V>)e).nextTable;
                        continue outer;
                    }
                    else
                        return e.find(h, k);
                }
                if ((e = e.next) == null)
                    return null;
            }
        }
    }
}

总结

本文将ConcurrentHashMap重要的数据结构和思想做了大致的介绍，ConcurrentHashMap效率高的原因主要是：

对Hash桶分段加锁
尽可能尝试CAS更新，否则才升级到Synchronized同步（put等方法）
增加多线程协助扩容，帮助迁移
增加counterCells帮助计数，减少冲突

参考

https://sylvanassun.github.io/2018/03/16/2018-03-16-map_family/
https://blog.csdn.net/u011392897/article/details/60479937

人面猴
序言：七十年代末，一起剥皮案震惊了整个滨河市，随后出现的几起案子，更是在滨河造成了极大的恐慌，老刑警刘岩，带你破解...
沈念sama阅读 158,425评论 4赞 361
死咒
序言：滨河连续发生了三起死亡事件，死亡现场离奇诡异，居然都是意外死亡，警方通过查阅死者的电脑和手机，发现死者居然都...
沈念sama阅读 67,058评论 1赞 291
救了他两次的神仙让他今天三更去死
文/潘晓璐我一进店门，熙熙楼的掌柜王于贵愁眉苦脸地迎上来，“玉大人，你说我怎么就摊上这事。” “怎么了？”我有些...
开封第一讲书人阅读 108,186评论 0赞 243
道士缉凶录：失踪的卖姜人
文/不坏的土叔我叫张陵，是天一观的道长。经常有香客问我，道长，这世上最难降的妖魔是什么？我笑而不...
开封第一讲书人阅读 43,848评论 0赞 204
港岛之恋（遗憾婚礼）
正文为了忘掉前任，我火速办了婚礼，结果婚礼上，老公的妹妹穿的比我还像新娘。我一直安慰自己，他们只是感情好，可当我...
茶点故事阅读 52,249评论 3赞 286
恶毒庶女顶嫁案：这布局不是一般人想出来的
文/花漫我一把揭开白布。她就那样静静地躺着，像睡着了一般。火红的嫁衣衬着肌肤如雪。梳的纹丝不乱的头发上，一...
开封第一讲书人阅读 40,554评论 1赞 216
城市分裂传说
那天，我揣着相机与录音，去河边找鬼。笑死，一个胖子当着我的面吹牛，可吹牛的内容都是我干的。我是一名探鬼主播，决...
沈念sama阅读 31,830评论 2赞 312
双鸳鸯连环套：你想象不到人心有多黑
文/苍兰香墨我猛地睁开眼，长吁一口气：“原来是场噩梦啊……” “哼！你这毒妇竟也来了？” 一声冷哼从身侧响起，我...
开封第一讲书人阅读 30,536评论 0赞 197
万荣杀人案实录
序言：老挝万荣一对情侣失踪，失踪者是张志新（化名）和其女友刘颖，没想到半个月后，有当地人在树林里发现了一具尸体，经...
沈念sama阅读 34,239评论 1赞 241
护林员之死
正文独居荒郊野岭守林人离奇死亡，尸身上长有42处带血的脓包…… 初始之章·张勋以下内容为张勋视角年9月15日...
茶点故事阅读 30,505评论 2赞 244
白月光启示录
正文我和宋清朗相恋三年，在试婚纱的时候发现自己被绿了。大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
茶点故事阅读 32,004评论 1赞 258
活死人
序言：一个原本活蹦乱跳的男人离奇死亡，死状恐怖，灵堂内的尸体忽然破棺而出，到底是诈尸还是另有隐情，我是刑警宁泽，带...
沈念sama阅读 28,346评论 2赞 253
日本核电站爆炸内幕
正文年R本政府宣布，位于F岛的核电站，受9级特大地震影响，放射性物质发生泄漏。R本人自食恶果不足惜，却给世界环境...
茶点故事阅读 32,999评论 3赞 235
男人毒药：我在死后第九天来索命
文/蒙蒙一、第九天我趴在偏房一处隐蔽的房顶上张望。院中可真热闹，春花似锦、人声如沸。这庄子的主人今日做“春日...
开封第一讲书人阅读 26,060评论 0赞 8
一桩弑父案，背后竟有这般阴谋
文/苍兰香墨我抬头看了看天上的太阳。三九已至，却和暖如春，着一层夹袄步出监牢的瞬间，已是汗流浃背。一阵脚步声响...
开封第一讲书人阅读 26,821评论 0赞 194
情欲美人皮
我被黑心中介骗来泰国打工，没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留，地道东北人。一个月前我还...
沈念sama阅读 35,574评论 2赞 271
代替公主和亲
正文我出身青楼，却偏偏与公主长得像，于是被迫代替她去往敌国和亲。传闻我的和亲对象是个残疾皇子，可洞房花烛夜当晚...
茶点故事阅读 35,480评论 2赞 267