HashMap解析

从另一个角度来解析HashMap到底是怎么实现的,试着自己实现一个HashMap。我们就实现一些常用的方法,掌握了主要的几个方法就能知晓原理了。

把K和V封装成一个实体Entry,然后HashMap内部维护一个Entry[]数组,就可以实现最基本的功能了。

public class HashMap<K, V> {

    public HashMap() {
        table = new Entry[16];// 源码方案,默认16
    }

    public HashMap(int initialCapacity) {
        int capacity = 2;
        while (capacity < initialCapacity)
            capacity = capacity * 2;// 源码方案,一定是2的倍数
        table = new Entry[capacity];
    }

    private Entry<K, V>[] table;
    private int size;

    public V put(K key, V value) {
        for (int i = 0; i < size; i++) {
            Entry<K, V> e = table[i];
            V oldValue = e.value;
            if (key.equals(e.key)) {
                e.value = value;
                return oldValue;
            }
        }
        table[size] = new Entry(key, value);
        size++;
        return null;
    }

    public V get(K key) {
        for (int i = 0; i < size; i++) {
            Entry<K, V> e = table[i];
            if (key.equals(e.key)) {
                return e.value;
            }
        }
        return null;
    }

    public int size() {
        return size;
    }

    class Entry<K, V> {
        private final K key;
        private V value;

        public Entry(K key, V value) {
            this.key = key;
            this.value = value;
        }
    }
}

put()的时候如果数组满了就要扩容

public V put(K key, V value) {
    for (int i = 0; i < size; i++) {
        Entry<K, V> e = table[i];
        V oldValue = e.value;
        if (e.key.equals(key)) {
            e.value = value;
            return oldValue;
        }
    }
    table[size] = new Entry(key, value);
    size++;
    if (size == table.length) {
        resize();
    }
    return null;
}

private void resize() {
    Entry<K, V>[] newTable = new Entry[table.length * 2];// 源码方案,满了就将数组长度翻倍
    for (int i = 0; i < table.length; i++) {
        newTable[i] = table[i];
    }
    table = newTable;
}

写到这里,一个最基本的HashMap就实现了。

一个合格的程序员,写完代码都应该思考下,这样写效率是不是太低了。
如果已经存了1000个值,那每次get和put都有可能需要遍历1000次,想想有没有办法可以优化。
如有有一个方法只要根据key,就可以知道在数组table的index,那就不用遍历了。比如index = key.hashcode()%2,这样index不是0就是1,显然不对,但是至少提示了我们可以把Entry分成2组进行存储,然后再去这2组里面去找我们想要的Entry。同一个index,table[index]怎么同时存储多个Entry呢?稍微改下Entry类,增加一个next

class Entry<K, V> {
    private final K key;
    private V value;
    private Entry<K, V> next;

    public Entry(K key, V value, Entry<K, V> next) {
        this.key = key;
        this.value = value;
        this.next = next;
    }
}

增加一个获取index的方法

private int indexFor(int hash, int length) {
    return hash % length;// 分成length组,也确保index不越界
}

然后改造下put()和get()

public V get(K key) {
    int index = indexFor(key.hashCode(), table.length);
    Entry<K, V> e = table[index];
    while (e != null) {
        if (key.equals(e.key)) {
            return e.value;
        }
        e = e.next;
    }
    return null;
}

public V put(K key, V value) {
    int index = indexFor(key.hashCode(), table.length);
    Entry<K, V> e = table[index];
    while (e != null) {
        if (key.equals(e.key)) {
            V oldValue = e.value;
            e.value = value;
            return oldValue;
        }
        e = e.next;
    }
    /*
     * 相同的index通过next连接起来,比如Entry a、b、c的index相同,put先后顺序是 c、b、a
     * 那么他们的关系就是
     * a.next = b
     * b.next = c
     * c.next = null
     */
    table[index] = new Entry<K, V>(key, value, table[index]);
    size++;
    if (size == table.length) {
        resize();
    }
    return null;
}

只要让index尽可能分散(即next层次尽可能浅)遍历的次数就会远远低于没改造前了,是不是感觉优化了不少。

有没有发现还有个问题,如果调用过resize()呢,那么indexFor()返回的值就会跟之前的不一样了。
解决方法就是resize()的时候把所有的Entry取出来,再根据indexFor()算法赋予给newTable[]

private void resize() {
    Entry<K, V>[] newTable = new Entry[table.length * 2];
    for (int i = 0; i < table.length; i++) {
        Entry<K, V> e = table[i];
        if (e != null) {
            do {
                Entry<K, V> next = e.next;
                int index = indexFor(e.key.hashCode(), newTable.length);
                Entry<K, V> oldEntry = newTable[index];
                newTable[index] = e;
                newTable[index].next = oldEntry;
                e = next;
            } while (e != null);
        }
    }
    table = newTable;
}

写到这里,应该基本掌握了HashMap的原理,当然源码还是比这复杂一些,比如我没处理key==null的情况,还有一些其他方法没有实现,JDK1.8引入了红黑树,当链表长度超过8的时候,使用红黑树。

其实HashMap源码里获取index,会对key.hashCode()再次加工,让index更加分散,int index = hash(key) & (length -1)

int hash(K key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

上文我们自己写的indexFor方法是index = hashCode%length,为什么JDK要写成index=hash&(length - 1),关键点在于HashMap设定的length是2的幂次方,那么hashCode%length就等同于hashCode & (length - 1),2的幂次方-1有个特点就是高位都是0,低位全是1,那hashCode&(length - 1)时,hashCode只有低位参与运算,为了优化、降低碰撞的概率,让hashCode的高位也参与运算,就有了hash=hashCode^(hashCode>>>16)

再说说hashCode()和equals()
我们知道HashMap里存取都是先去取table[index],而index是根据key.hashCode()来生成的,看Object类

public native int hashCode();

public boolean equals(Object obj) {
    return (this == obj);
}

hashCode()就是返回内存地址,而equals()直接判断内存地址,举个例子

class Student {
    public int id;
    public String name;
}

Student a = new Student();
Student b = new Student();
a.id = 1;
a.name = "小明";
b.id = 1;
b.name = "小明";

那么a.equals(b)就是false,而且a.hashCode()也和b.hashCode()不相等
如果用Student做HashMap的key,我们显然想要的是a和b就是同一个key,那么我们只能自己重写这2个方法了,比如

class Student {
    public int id;
    public String name;
    public int hashCode(){
        return id + name.hashCode();
    }
    public boolean equals(Student s){
        return s.id == id && s.name.equals(name);
    }
}

为什么我们用String、Integer等做key没有问题,是因为它们已经实现了这两个方法。

总得来说,equals()返回true,那么hashCode()必须相等,而hashCode()相等,equals()可以返回false


额外说下HashSet,由于比较简单,就不开新篇

public HashSet() {
    map = new HashMap<>();
}

private static final Object PRESENT = new Object();

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

内部维护一个map,把element当做key,put到map,这样就能确保HashSet的值是唯一的了,非常简单。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 160,108评论 4 364
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 67,699评论 1 296
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 109,812评论 0 244
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 44,236评论 0 213
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 52,583评论 3 288
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 40,739评论 1 222
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 31,957评论 2 315
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 30,704评论 0 204
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 34,447评论 1 246
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 30,643评论 2 249
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 32,133评论 1 261
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 28,486评论 3 256
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 33,151评论 3 238
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 26,108评论 0 8
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 26,889评论 0 197
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 35,782评论 2 277
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 35,681评论 2 272

推荐阅读更多精彩内容

  • 实际上,HashSet 和 HashMap 之间有很多相似之处,对于 HashSet 而言,系统采用 Hash 算...
    曹振华阅读 2,499评论 1 37
  • HashMap 可以算是 Java 中最常用的几个集合类之一。这一篇文章将在代码层面上详细解释 HashMap 的...
    王聪帅阅读 576评论 0 1
  • 前言 今天来介绍下HashMap,之前的List,讲了ArrayList、LinkedList,就前两者而言,反映...
    嘟爷MD阅读 2,845评论 2 56
  • 5.1、对于HashMap需要掌握以下几点 Map的创建:HashMap() 往Map中添加键值对:即put(Ob...
    rochuan阅读 611评论 0 0
  • 遇见了简书如同是遇见了心灵的归宿 一个人的生活难免会孤单寂寞,尤其是夜深人静的时候。我时常会用看电视、听...
    点滴奇遇阅读 327评论 0 0