Java最好的学习方式就是阅读源代码。结合源代码记录Java中两个支持并发的map结构。
Hashtable
如上图截取的Hashtable源代码片段,在Hashtable类中所有的方法均使用关键字synchronized修饰,也就是在一个时刻只能有一条线程访问Hashtable中存储的数据,显然Hashtable是线程安全的。但同时使用synchronized对整个Hashtable的对象实例加锁,在性能无法发挥多线程多处理器的优势,所以JDK5引入了新的并发容器ConcurrentHashMap。
ConcurrentHashMap
说到ConcurrentHashMap就需要按照两个版本讲起,JDK7和JDK8,在这两个JDK版本ConcurrentHashMap的实现有了巨大的改变,但是本质上仍旧是细化锁的粒度,实现同一时刻多条线程可以并行访问ConcurrentHashMap实例对象。
ConcurrentHashMap JDK7版本
在JDK7版本中,ConcurrentHashMap使用了一种叫做分段锁(Lock Striping)的技术。
在某些情况下,可以将锁分解技术进一步扩展为对一组独立对象上的锁进行分解,这种情况被称为锁分段。
——《Java并发编程实战》
锁分段是一种粒度更细的加锁机制,最大限度的实现共享。锁分段与采用单个锁来实现独占访问相比,要获取多个锁来实现独占访问将更加困难并且开销更高。例如ConcurrentHashMap需要扩展映射范围,以及重新计算键值的散列值分布到更大的桶集合中时,就需要获取分段集合中所有的锁。
ConcurrentHashMap类中定义Segment数组(Segment类是在ConcurrentHashMap类中的内部类)作为分段锁对象。Segment数组中每个Segments对象实例就是一个锁。ConcurrentHashMap类把整张表拆分为Segment数组大小(默认值16)个小表,每个Segment对象实例的锁就负责一张对应的小表。这样当访问ConcurrentHashMap的请求到来时,获取数据所在小表的锁既可,其他的小表仍旧可以同时被其他线程操作。
Segment数组和对应的哈希表结构如下:
下面是ConcurrentHashMap类中的put方法,这段代码主要关注最后一行,新的key-value键值对首先要放入选中的Segment元素中,这里调用Segment类的put方法。Segment类的put方法与Java中哈希表HashMap相似,唯一区别需要加锁,不再赘述,详情可参看Java的HashMap源码解析(中高级Java工程师面试必备)。
public V put(K key, V value) {
Segment<K,V> s;
if (value == null)
throw new NullPointerException();
int hash = hash(key);
int j = (hash >>> segmentShift) & segmentMask;
if ((s = (Segment<K,V>)UNSAFE.getObject // nonvolatile; recheck
(segments, (j << SSHIFT) + SBASE)) == null) // in ensureSegment
s = ensureSegment(j);
//新的key-value键值对首先要放入选中Segment元素中
return s.put(key, hash, value, false);
}
ConcurrentHashMap JDK8版本
JDK8在原有基础上增加红黑树结构,如果哈希表的某个桶中结点数量过多,链表结构会进行树化,转换为红黑树结构存储结点。
在分段锁方面,抛弃了JDK7中Segment数组的实现方式,改为了CAS操作+关键字synchronized加锁组合的方式实现。
如下代码片段,是插入一个数据的操作。
- ①号标识的代码,调用casTabAt()函数进行CAS操作,当插入的空桶时不需要加锁。
- ②号标识的代码,在桶中插入新的节点,对根据key定位的出的第一个node结点加内置锁,保证相同哈希值的结点操作具有相同的锁进行保护。
- 补充③号标识的代码,帮助执行resize扩容操作
final V putVal(K key, V value, boolean onlyIfAbsent) {
if (key == null || value == null) throw new NullPointerException();
int hash = spread(key.hashCode());
int binCount = 0;
for (Node<K,V>[] tab = table;;) {
Node<K,V> f; int n, i, fh;
if (tab == null || (n = tab.length) == 0)
tab = initTable();
else if ((f = tabAt(tab, i = (n - 1) & hash)) == null) {
if (casTabAt(tab, i, null, new Node<K,V>(hash, key, value, null)))//①
break; // no lock when adding to empty bin
}
else if ((fh = f.hash) == MOVED)
tab = helpTransfer(tab, f);//③
else {
V oldVal = null;
synchronized (f) {//②
if (tabAt(tab, i) == f) {
......省略余下的代码........
}
ConcurrentHashMap扩容
- JDK7扩容时会对Segment数组元素加锁,不同的Segment元素之间可以并发操作。
- JDK8不再使用Segment数组,引入了一个ForwardingNode类,当某个桶中的元素进行扩容时,ForwardingNode的节点会被插入到桶的头部。扩容时,get方法和put方法都会判断头部的节点是否为ForwardingNode节点,如果是,这个桶正在进行扩容。put方法当前的线程帮助扩容(上面代码片段③逻辑),之后for循环继续执行put操作。get方法以自旋的方式不断尝试读取。