Java数据结构-散列表

前言

首先给大家抛一个问题,现有一个Person类包含name(假设姓名唯一)属性,要从1000Person对象中找出name为“张三”的对象你该怎么做?有些同学要说话了:将1000Person对象放入ArrayList中,再遍历ArrayList找出name为“张三”的对象不就得了。是的这种方法是可以的,但是假如张三恰好在最后一个那么就意味着要遍历1000次,这样效率就会非常低下,那么我们有没有什么办法来解决这种问题呢?别急学完散列表数据结构后答案自会揭晓。

1. 概述

什么是散列表数据结构呢?来看一下它的官方解释:

散列表(也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。

什么乱七八糟的,越看越晕~~~其实就是通过键将一条记录保存到表中响应的位置,再通过键从表中取出记录。是不是有种似曾相识的感觉?没错Java中的HashTableHashMap内部就是散列表数据结构。

2. 散列表设计

回到前面1000个Person的话题,假设如果我们用一个数组来存储Person对象,通过一个算法将Person中的name返回一个int类型值(这个算法也称之为hash算法),我们就将这个int类型值最为数组的角标存储在数组中,获取的时候直接通过hash算法计算出数组角标然后直接获取到对应角标的元素,通过这种方式可以很大程度的提升查询效率。

嗯,看似很完美,那么问题来了,如果通过hash算法得到的int值为10000那么是不是就意味着我至少要创建一个长度为10000的数组?看似是这样的,问题更严重,我还是老老实实用我的ArrayList吧~~~~哈哈哈,有问题就要解决啊,要不然我写着文章还有mao用。。。首先我们可不可以这样做,我们将hash算法得到的值进行一个限制比如0-15,这样我们创建一个长度为16的数组就行了,那那那那问题又来了,假如张三李四通过hash计算得到的值都是5而数组中一个角标只能存一个元素,怎么搞???其实这种情况就是我们经常听说的哈希冲突,怎么解决?别急,请看下一小节。

3. 哈希冲突

解决哈希冲突的方法有很多,本篇文章就选一种比较典型方式:链表法,所以不了解链表数据结构的同学可以先去熟悉一下。再回到Person的例子,假如张三李四的hash值都是5那么我们可以将张三放在数组的第5个位置,李四以链表的形式放在张三后面,又来个王五hash值恰好也是5,那么我们就可以将王五放在李四的后面了,以此类推。详情如下图所示:

hash.png

查询的时候首先计算出hash值得到角标,通过角标找到对应的链表头结点,然后再根据key值去链表中找具体的元素。

4. 代码实现

通过上面几个小节相信你已经熟悉了散列表的数据结构,下面我来带着大家通过代码实现一个简单的HashMap。实现步骤如下:

  • 设计节点类
  • 设计hash算法
  • 插入元素
  • 扩展数组
  • 查询元素
4.1 设计节点类

本例中解决哈希冲突采用单向链表,代码如下:

 //节点对象
    public class Node<K,V>{
        K key;//键
        V value;//值
        Node<K,V> next;//下一个节点对象
        public Node(K key,V value,Node<K,V> next){
            this.key = key;
            this.value = value;
            this.next = next;
        }
    }

节点的键值为泛型类型,包含三个属性:键、值、后继节点,没啥难的就不多做解释。

4.2 hash算法

前面我提到过hash算法有很多种,本篇文章侧重点为散列表数据结构,所以我就设计了一个较为简单的hash算法(难的我也写不出来啊~~~),代码如下:

    //传入key值
    public int hash(K key){
        //获取到key的hashCode值
        int code = key.hashCode();
        //defaultCapacity为数组长度,默认为16
        return code%(defaultCapacity-1);
    }

是有点简单,加上大括号才四行代码。。。。defaultCapacity为当前数组的长度,所以该hash算法的值被限制在了0-(defaultCapacity-1)。

4.3 插入元素

插入元素需要考虑的因素比较多,我个人把它细分为4步
步骤:

  • 计算key的哈希值,即存储角标
  • 判断key值是否已经存在(散列表中不允许重复key),如果存在就将value替换
  • 判断是否需要扩容(下一小节会讲到)
  • 将key、value生成节点对象以头结点的形式存入到数组中

代码:

   //添加元素
    public V put(K key,V value){
        //初始化数组
        if(nodes==null){
            nodes = new Node[defaultCapacity];
        }
        int index = hash(key);//计算存储角标
        //获取到数组角标元素,可视为头结点
        Node<K,V> node = nodes[index];
        //遍历链表中节点对象
        while (node!=null){
            //存在重复key将value替换
            if(node.key.equals(key)){
                node.value = value;
                return value;
            }else {
                node = node.next;
            }
        }
        //判断是否需要扩展defaultCapacity为数组长度,
        //defaultLoadFactor为扩展因子默认0.75
        if(size>=defaultCapacity*defaultLoadFactor){
            resize();
        }
        //将新添加的数据作为头结点添加到数组中
        nodes[index] = new Node<>(key,value,nodes[index]);
        size++;
        return value;
    }
4.4 扩展数组

关于数组扩容这一块我详细说一下,如果defaultCapacity的值始终是16,那么当数据量较大的情况下数组中的链表会很长,虽然通过hash算法可以得到角标中头结点,但仍要花大量时间去链表中查找元素,所以要在相应的时机对数组进行扩容,扩容后对所有数据重新再散列。一般来说通过定义的扩展因子来决定是否扩容,假如扩展因子为0.75,那么当散列表中元素达到defaultCapacity*0.75时需进行扩容操作。具体代码如下:

//扩展数组
    public void resize(){
        //扩容后要对元素重新put(重新散列),所以要将size置为0
        size=0;
        //记录先之前的数组
        Node<K,V>[] oldNodes = nodes;
        defaultCapacity = defaultCapacity*2;
        nodes = new Node[defaultCapacity];
        //遍历散列表中每个元素
        for (int i = 0;i<oldNodes.length;i++){
            //扩容后hash值会改变,所以要重新散列
            Node<K,V> node = oldNodes[i];
            while (node!=null){
                Node<K,V> oldNode = node;
                put(node.key,node.value);//散列
                node = node.next;//角标往后移
                oldNode.next = null;//将当前散列的节点next置为null
            }
        }
    }

重新散列后一定要将当前节点的next置为null。注释写的很清楚就不过多赘述。

4.5 查询元素

查询元素就比较简单了,首先通过hash算法计算出角标位置,然后获取头结点再对链表进行遍历,如果存在符合的key就将value返回,代码如下:

 //获取元素
    public V get(K key){
        //获取角标位置
        int index = hash(key);
        //获取头结点
        Node<K,V> node = nodes[index];
        if(node!=null){
            //遍历链表
            while (node!=null&&!node.key.equals(key)){
                node = node.next;
            }
            if(node==null){
                return null;
            }else {
                return node.value;
            }
        }
        return null;
    }
4.6 完整代码
public class ZsHashMap<K,V> {
    private Node<K,V>[] nodes;//存储头节点的数组
    private int size;//元素个数
    private static int defaultCapacity = 16;//默认容量
    private static float defaultLoadFactor = 0.75f;//扩展因子
    public ZsHashMap(){}
    public ZsHashMap(int capacity,int loadFactor){
        defaultCapacity = capacity;
        defaultLoadFactor = loadFactor;
    }
    //添加元素
    public V put(K key,V value){
        //初始化数组
        if(nodes==null){
            nodes = new Node[defaultCapacity];
        }
        int index = hash(key);//计算存储角标
        //获取到数组角标元素,可视为头结点
        Node<K,V> node = nodes[index];
        //遍历链表中节点对象
        while (node!=null){
            //存在重复key将value替换
            if(node.key.equals(key)){
                node.value = value;
                return value;
            }else {
                node = node.next;
            }
        }
        //判断是否需要扩展defaultCapacity为数组长度,
        //defaultLoadFactor为扩展因子默认0.74
        if(size>=defaultCapacity*defaultLoadFactor){
            resize();
        }
        //将新添加的数据作为头结点添加到数组中
        nodes[index] = new Node<>(key,value,nodes[index]);
        size++;
        return value;
    }
    //获取元素
    public V get(K key){
        //获取角标位置
        int index = hash(key);
        //获取头结点
        Node<K,V> node = nodes[index];
        if(node!=null){
            //遍历链表
            while (node!=null&&!node.key.equals(key)){
                node = node.next;
            }
            if(node==null){
                return null;
            }else {
                return node.value;
            }
        }
        return null;
    }
    //扩展数组
    public void resize(){
        //扩容后要对元素重新put(重新散列),所以要将size置为0
        size=0;
        //记录先之前的数组
        Node<K,V>[] oldNodes = nodes;
        defaultCapacity = defaultCapacity*2;
        nodes = new Node[defaultCapacity];
        //遍历散列表中每个元素
        for (int i = 0;i<oldNodes.length;i++){
            //扩容后hash值会改变,所以要重新散列
            Node<K,V> node = oldNodes[i];
            while (node!=null){
                Node<K,V> oldNode = node;
                put(node.key,node.value);//重新散列
                node = node.next;//指针往后移
                oldNode.next = null;//将当前散列的节点next置为null
            }
        }
    }
    //hash算法
    public int hash(K key){
        int code = key.hashCode();
        return code%(defaultCapacity-1);
    }
    //节点对象
    public class Node<K,V>{
        K key;
        V value;
        Node<K,V> next;
        public Node(K key,V value,Node<K,V> next){
            this.key = key;
            this.value = value;
            this.next = next;
        }
    }
}

来做一下测试:

ZsHashMap<String,Integer> map = new ZsHashMap<>();
        map.put("a",1);
        map.put("b",2);
        map.put("b",3);
        System.out.println(map.get("a"));
        System.out.println(map.get("b"));

打印结果:

1
3

我刻意的将b添加两次,从打印结果来看第二次对第一次进行了覆盖。到这一个简单的散列表就实现了,其实还可以加入很多扩展的方法, 比如remove()、迭代器等等文章中就比一一讲解,感兴趣的同学可以自己实现。

总结

我一直都认为,一个合格的Coder要保持一种精神:“知其然更要知其所以然”,比如今天的散列表,如果你不清楚它的内部原理你是不会明白它的优点是什么,更别说去灵活的运用,当然学习数据结构好处远不止此。本篇文章内容差不多就这些了,以后我还会陆续推出数据结构的文章,希望大家继续关注。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,445评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,889评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,047评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,760评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,745评论 5 367
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,638评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,011评论 3 398
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,669评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,923评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,655评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,740评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,406评论 4 320
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,995评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,961评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,023评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,483评论 2 342