散列(二)

上一章 散列(一) 主要介绍了散列的基本概念以及冲突解决方法--分离链表法。这一章主要介绍解决冲突的另一种方法---开放定址法。

开放定址法:尝试另外一些单元,直到找出空的单元为止。
  • 线性探测法:当产生冲突时,它将寻找下一个空闲地址放入。
  • 平方探测法:使用 f(i) = i 2 的方法来解决冲突,并且保证如果表有一半为空,并且表的大小为素数,那么我们保证总能够插入一个新的元素。
  • 双散列:使用如下探测方法:


    double_hashing.png
线性探测法:

在线性探测法中,函数f是i的线性函数,典型的情形为f(i) = i 。 这相当于探测逐个单元(必要时可以回绕)以查找出一个空单元。

线性探测.png

如上图,我们逐个插入关键字{89,18,49,58,69}。第一个冲突发生在插入49关键字,它和89产生了冲突(因为49%10=9且89%10=9),因此,49被推入下一个空闲位置,即位置0 (注意这里是可以回绕的) ,紧接着插入58,58和18冲突了,则找下一个空闲位置,找到位置1.对于69的冲突也是一样的。

我们发现即使表相对较空,还是会发生一些占据的单元集中在一些块区,这种现象我们成为一次聚集
也就是说,散列在区块中的任何关键字都需要多次试选单元才能解决冲突,然后将关键字添加进去。

实验证明,当装填因子(散列表中元素个数与该表大小的比)在0 ~ 0.5之间所需探测的次数时较小的,考虑到探测次数和rehash的消耗,我们一般采用0.5作为装填因子会达到比较好的效果。

线性探测.png
平方探测法
  • 平方探测法是消除线性探测中一次聚集问题的解决冲突的方法。平方探测就是冲突函数为二次的探测方法。
  • 对于线性探测,让散列表中填满元素并不是一个好主意,因为此时表的性能在下降。而对于平方探测方法情况甚至更糟:一旦表被填充了一半,当表的大小不是素数时甚至在表被填充一半之前,就不能保证一次找到空的单元了。这是因为最多有表的一半作为解决冲突的备选位置
  • 定理:** 如果使用平方探测,且表的大小是素数,那么当表至少有一半是空的时候,总能够插入一个新的元素**。
  • 在探测散列表中的删除操作,我们不能直接执行,因为相应的单元可能已经引起过冲突,被转移到其他地方了。

a. 定义一个类用来标记每个位置的值以及其是否处于活动状态(即是否存在值)

    /**
     * 定义一个类用来标记每个位置的情况
     * @param <AnyType>
     */
    private static class HashEntry<AnyType>{
        //当前位置的元素值
        public AnyType element;
        //当前位置是否为活动状态,默认为活动状态,但若删除后,会设置其为非活动状态
        public boolean isActive;

        public HashEntry(AnyType e){
            this(e, true);
        }

        public HashEntry(AnyType e, boolean b){
            element = e;
            isActive = b;
        }
    }

b. 定义所需变量:

    //默认表的大小
    private static final int DEFAULT_TABLE_SIZE = 11;
    //存储表
    private HashEntry<AnyType> [] array;
    //当前表的大小
    private int currentSize;

c. 进行初始化操作:

    //无参数构造函数
    public QuadraticProbingHashTable(){
        this(DEFAULT_TABLE_SIZE);
    }
    //有参数构造函数
    public QuadraticProbingHashTable(int size){
        allocateArray(size);
        makeEmpty();
    }
    //清空表
    public void makeEmpty(){
        currentSize = 0;
        for (int i = 0; i < array.length; i ++){
            array[i] = null;
        }
    }
    //初始化表
    private void allocateArray(int size){
        array = new HashEntry[nextPrime(size)];
    }

c. 解决冲突位置:

    /**
     * 寻找空闲位置,以解决冲突
     * @param x
     * @return
     */
    private int findPos(AnyType x){
        //定义偏移量
        int offset = 1;
        //获取到hash位置
        int currentPos = myHash(x);
        //若hash位置中存在元素,并且当前元素不等于传入的元素
        while (array[currentPos] != null && !array[currentPos].element.equals(x)){
            //进行偏移
            currentPos += offset;
            //改变偏移量
            offset += 2;
            //考虑到溢出情况
            if (currentPos >= array.length){
                currentPos -= array.length;
            }
        }
        return currentPos;
    }

d. 插入操作:

    //插入元素
    public void insert(AnyType x){
        //获取到空闲位置
        int currentPos = findPos(x);
        //若该位置为活动状态,则返回,表示该位置已经存在元素
        //这种情况,实际上表示该位置上已经存在了该元素,那么不必重复插入
        if (isActive(currentPos)){
            return;
        }
        //否则,插入该元素
        array[currentPos] = new HashEntry<AnyType>(x);
        //判断表的大小,超过一半,则进行rehash
        if (++ currentSize > array.length / 2){
            rehash();
        }
    }
    //判断当前位置是否为活动状态
    private boolean isActive(int currentPos){
        return array[currentPos] != null && array[currentPos].isActive;
    }

e. 删除操作:

public void remove(AnyType x){
        //找到位置
        int currentPos = findPos(x);
        //若该位置为活动状态,则进行删除操作
        if (isActive(currentPos)){
            //令该位置为非活动状态即可
            array[currentPos].isActive = false;
            currentSize --;
        }
    }

f. 查询操作:

public boolean contains(AnyType x){
        int currentPos = findPos(x);
        //返回该位置是否为活动状态
        return isActive(currentPos);
 }

g. rehash操作:

private void rehash(){
        HashEntry<AnyType> [] oldArray = array;
        //扩充表的大小
        allocateArray(nextPrime(2 * oldArray.length));
        currentSize = 0;
        //将旧表的数据添加到新表中
        for (int i = 0; i < oldArray.length; i ++){
            if (oldArray[i] != null && oldArray[i].isActive){
                insert(oldArray[i].element);
            }
        }
    }
完整代码:
public class QuadraticProbingHashTable<AnyType> {
    //无参数构造函数
    public QuadraticProbingHashTable(){
        this(DEFAULT_TABLE_SIZE);
    }
    //有参数构造函数
    public QuadraticProbingHashTable(int size){
        allocateArray(size);
        makeEmpty();
    }
    //清空表
    public void makeEmpty(){
        currentSize = 0;
        for (int i = 0; i < array.length; i ++){
            array[i] = null;
        }
    }

    public boolean contains(AnyType x){
        int currentPos = findPos(x);
        //返回该位置是否为活动状态
        return isActive(currentPos);
    }

    //插入元素
    public void insert(AnyType x){
        //获取到空闲位置
        int currentPos = findPos(x);
        //若该位置为活动状态,则返回,表示该位置已经存在元素
        //这种情况,实际上表示该位置上已经存在了该元素,那么不必重复插入
        if (isActive(currentPos)){
            return;
        }
        //否则,插入该元素
        array[currentPos] = new HashEntry<AnyType>(x);
        //判断表的大小,超过一半,则进行rehash
        if (++ currentSize > array.length / 2){
            rehash();
        }
    }

    public void remove(AnyType x){
        //找到位置
        int currentPos = findPos(x);
        //若该位置为活动状态,则进行删除操作
        if (isActive(currentPos)){
            //令该位置为非活动状态即可
            array[currentPos].isActive = false;
            currentSize --;
        }
    }

    /**
     * 定义一个类用来标记每个位置的情况
     * @param <AnyType>
     */
    private static class HashEntry<AnyType>{
        //当前位置的元素值
        public AnyType element;
        //当前位置是否为活动状态,默认为活动状态,但若删除后,会设置其为非活动状态
        public boolean isActive;

        public HashEntry(AnyType e){
            this(e, true);
        }

        public HashEntry(AnyType e, boolean b){
            element = e;
            isActive = b;
        }
    }

    //默认表的大小
    private static final int DEFAULT_TABLE_SIZE = 11;
    //存储表
    private HashEntry<AnyType> [] array;
    //当前表的大小
    private int currentSize;

    //初始化表
    private void allocateArray(int size){
        array = new HashEntry[nextPrime(size)];
    }

    //判断当前位置是否为活动状态
    private boolean isActive(int currentPos){
        return array[currentPos] != null && array[currentPos].isActive;
    }

    /**
     * 寻找空闲位置,以解决冲突
     * @param x
     * @return
     */
    private int findPos(AnyType x){
        //定义偏移量
        int offset = 1;
        //获取到hash位置
        int currentPos = myHash(x);
        //若hash位置中存在元素,并且当前元素不等于传入的元素
        while (array[currentPos] != null && !array[currentPos].element.equals(x)){
            //进行偏移
            currentPos += offset;
            //改变偏移量
            offset += 2;
            //考虑到溢出情况
            if (currentPos >= array.length){
                currentPos -= array.length;
            }
        }
        return currentPos;
    }


    private void rehash(){
        HashEntry<AnyType> [] oldArray = array;
        //扩充表的大小
        allocateArray(nextPrime(2 * oldArray.length));
        currentSize = 0;
        //将旧表的数据添加到新表中
        for (int i = 0; i < oldArray.length; i ++){
            if (oldArray[i] != null && oldArray[i].isActive){
                insert(oldArray[i].element);
            }
        }
    }


    //根据值获取到其对应的hash位置
    private int myHash(AnyType x){
        int hashVal = x.hashCode();
        hashVal %= array.length;
        if (hashVal < 0){
            hashVal += array.length;
        }
        return hashVal;
    }

    //返回下一个素数
    private static int nextPrime(int n){
        while (!isPrime(n)){
            n ++;
        }
        return n;
    }
    //判断是否为素数
    private static boolean isPrime(int n){
        for (int i = 2; i <= Math.sqrt(n); i ++){
            if (n % i == 0 && n != 2){
                return false;
            }
        }
        return true;
    }

}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,293评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,604评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,958评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,729评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,719评论 5 366
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,630评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,000评论 3 397
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,665评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,909评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,646评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,726评论 1 330
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,400评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,986评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,959评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,197评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,996评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,481评论 2 342

推荐阅读更多精彩内容

  • Map 是一种很常见的数据结构,用于存储一些无序的键值对。在主流的编程语言中,默认就自带它的实现。C、C++ 中的...
    一缕殇流化隐半边冰霜阅读 9,244评论 23 67
  • 9.3.3 快速排序   快速排序将原数组划分为两个子数组,第一个子数组中元素小于等于某个边界值,第二个子数组中的...
    RichardJieChen阅读 1,832评论 0 3
  • 概念 散列表的实现常常叫做散列(hashing)。散列是一种用于以常数平均时间执行插入、删除和查找的技术。散列函数...
    NoFacePeace阅读 323评论 0 0
  • 冲突的普遍性 ⎯ ⎯ 生日悖论 我们可以考虑这样一个实际问题:某课堂上的所有学生中,是否由某两位在同一天过生日(称...
    峰峰小阅读 829评论 0 1
  • 冷静漂泊 微光还在频闪 我为你创造了所有灯红和酒绿 步步为营助长那些理想的花儿 千山越过边境 雨中 白玫瑰缀满了我...
    瑾阔徐行阅读 115评论 0 0