Java并发容器——Hashtable和ConcurrentHashMap

Java最好的学习方式就是阅读源代码。结合源代码记录Java中两个支持并发的map结构。

Hashtable

Hashtable源代码片段

如上图截取的Hashtable源代码片段，在Hashtable类中所有的方法均使用关键字synchronized修饰，也就是在一个时刻只能有一条线程访问Hashtable中存储的数据，显然Hashtable是线程安全的。但同时使用synchronized对整个Hashtable的对象实例加锁，在性能无法发挥多线程多处理器的优势，所以JDK5引入了新的并发容器ConcurrentHashMap。

ConcurrentHashMap

说到ConcurrentHashMap就需要按照两个版本讲起，JDK7和JDK8，在这两个JDK版本ConcurrentHashMap的实现有了巨大的改变，但是本质上仍旧是细化锁的粒度，实现同一时刻多条线程可以并行访问ConcurrentHashMap实例对象。

ConcurrentHashMap JDK7版本

在JDK7版本中，ConcurrentHashMap使用了一种叫做分段锁(Lock Striping)的技术。

在某些情况下，可以将锁分解技术进一步扩展为对一组独立对象上的锁进行分解，这种情况被称为锁分段。
——《Java并发编程实战》

锁分段是一种粒度更细的加锁机制，最大限度的实现共享。锁分段与采用单个锁来实现独占访问相比，要获取多个锁来实现独占访问将更加困难并且开销更高。例如ConcurrentHashMap需要扩展映射范围，以及重新计算键值的散列值分布到更大的桶集合中时，就需要获取分段集合中所有的锁。

ConcurrentHashMap类中定义Segment数组(Segment类是在ConcurrentHashMap类中的内部类)作为分段锁对象。Segment数组中每个Segments对象实例就是一个锁。ConcurrentHashMap类把整张表拆分为Segment数组大小(默认值16)个小表，每个Segment对象实例的锁就负责一张对应的小表。这样当访问ConcurrentHashMap的请求到来时，获取数据所在小表的锁既可，其他的小表仍旧可以同时被其他线程操作。

Segment数组和对应的哈希表结构如下：

ConcurrentHashMap JDK7版本数据结构

下面是ConcurrentHashMap类中的put方法，这段代码主要关注最后一行，新的key-value键值对首先要放入选中的Segment元素中，这里调用Segment类的put方法。Segment类的put方法与Java中哈希表HashMap相似，唯一区别需要加锁，不再赘述，详情可参看Java的HashMap源码解析(中高级Java工程师面试必备)。

public V put(K key, V value) {
    Segment<K,V> s;
    if (value == null)
        throw new NullPointerException();

    int hash = hash(key);
    int j = (hash >>> segmentShift) & segmentMask;
    if ((s = (Segment<K,V>)UNSAFE.getObject          // nonvolatile; recheck
            (segments, (j << SSHIFT) + SBASE)) == null) //  in ensureSegment
        s = ensureSegment(j);
    //新的key-value键值对首先要放入选中Segment元素中
    return s.put(key, hash, value, false);
}

ConcurrentHashMap JDK8版本

JDK8在原有基础上增加红黑树结构，如果哈希表的某个桶中结点数量过多，链表结构会进行树化，转换为红黑树结构存储结点。
在分段锁方面，抛弃了JDK7中Segment数组的实现方式，改为了CAS操作+关键字synchronized加锁组合的方式实现。
如下代码片段，是插入一个数据的操作。

①号标识的代码，调用casTabAt()函数进行CAS操作，当插入的空桶时不需要加锁。
②号标识的代码，在桶中插入新的节点，对根据key定位的出的第一个node结点加内置锁，保证相同哈希值的结点操作具有相同的锁进行保护。
补充③号标识的代码，帮助执行resize扩容操作

final V putVal(K key, V value, boolean onlyIfAbsent) {
    if (key == null || value == null) throw new NullPointerException();
    int hash = spread(key.hashCode());
    int binCount = 0;
    for (Node<K,V>[] tab = table;;) {
        Node<K,V> f; int n, i, fh;
        if (tab == null || (n = tab.length) == 0)
            tab = initTable();
        else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
            if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))//①
                    break;                   // no lock when adding to empty bin
            }
        else if ((fh = f.hash) == MOVED)
            tab = helpTransfer(tab, f);//③
        else {
            V oldVal = null;
            synchronized (f) {//②
                if (tabAt(tab, i) == f) {
            ......省略余下的代码........
}

ConcurrentHashMap扩容

JDK7扩容时会对Segment数组元素加锁，不同的Segment元素之间可以并发操作。
JDK8不再使用Segment数组，引入了一个ForwardingNode类，当某个桶中的元素进行扩容时，ForwardingNode的节点会被插入到桶的头部。扩容时，get方法和put方法都会判断头部的节点是否为ForwardingNode节点，如果是，这个桶正在进行扩容。put方法当前的线程帮助扩容(上面代码片段③逻辑)，之后for循环继续执行put操作。get方法以自旋的方式不断尝试读取。