数据结构与算法JavaScript描述(6) —— 散列(Hash)

散列

散列是一种常用的数据存储技术,散列后的数据可以快速地插入或取用。散列使用的数据结构叫做散列表。在散列表上插入、删除和取用数据都非常快,但是对于查找操作来说却效率低下,比如查找一组数据中的最大值和最小值。

散列表的实现基于数组,键为整型时,一般使用除留余数法(以数组的长度对键取值)来实现散列函数,数组的大小一般为质数。尽量避免键为字符串或其他类型。

散列表中两个键映射成同一个值的情况,叫作碰撞(collision)。

碰撞处理的方法:

  1. 开链法(使用多维数组)
  2. 线性检测法(开放寻址散列)
    当发生碰撞时,线性探测法检查散列表中的下一个位置是否为空。如果为空,就将数据存入该位置;如果不为空,则继续检查下一个位置,直到找到一个空的位置为止。

如何选择?
如果数组的大小是待存储数据的1.5倍,那么使用开链法;如果数组大小是待存储数据的两倍及两倍以上时,那么使用线性探测法。

开链法实现HashTable

class HashTable {

    constructor() {
        this.table = new Array(137)
    }

    // 除留余数(简单方法):当发生碰撞时,后面的值会覆盖之前的值
    simpleHash(data) {
        let total = 0
        for (let i = 0; i < data.length; i++) {
            total += data.charCodeAt(i)
        }
        return total % this.table.length
    }

    // 除留余数(霍纳算法)
    // 数组的长度最好在100以上,这样会让数据在散列表中分布得更加均匀
    // 为了避免碰撞,在给散列表一个合适的大小后,新的散列函数仍然先计算字符串中各字符的 ASCII 码值,不过求和时每次要乘以一个质数
    betterHash(data) {
        const H = 37
        let total = 0
        for (let i = 0; i < data.length; i++) {
            total += H * total + data.charCodeAt(i)
        }
        total = total % this.table.length
        if (total < 0) {
            total += this.table.length - 1
        }
        return total
    }

    // 显示散列表中的数据
    showDistro() {
        console.table(this.table)
    }

    // 将数据存入散列表
    put(data) {
        const pos = this.betterHash(data)
        if (this.table[pos]) {
            this.table[pos].push(data)
        } else {
            this.table[pos] = []
            this.table[pos].push(data)
        }
    }
}

// test
const names = ['David', 'Jennifer', 'Donnie', 'Hysunny', 'Raymond', 'Cynthia', 'Mike', 'Clayton', 'Danny', 'Jonathan']
const table = new HashTable()
names.forEach(item => {
    table.put(item)
})
table.showDistro()

线性检测法实现HashTable

class HashTable {

    constructor() {
        this.table = new Array(137)
    }

    // 除留余数(简单方法):当发生碰撞时,后面的值会覆盖之前的值
    simpleHash(data) {
        let total = 0
        for (let i = 0; i < data.length; i++) {
            total += data.charCodeAt(i)
        }
        return total % this.table.length
    }

    // 除留余数(霍纳算法)
    // 数组的长度最好在100以上,这样会让数据在散列表中分布得更加均匀
    // 为了避免碰撞,在给散列表一个合适的大小后,新的散列函数仍然先计算字符串中各字符的 ASCII 码值,不过求和时每次要乘以一个质数
    betterHash(data) {
        const H = 37
        let total = 0
        for (let i = 0; i < data.length; i++) {
            total += H * total + data.charCodeAt(i)
        }
        total = total % this.table.length
        if (total < 0) {
            total += this.table.length - 1
        }
        return total
    }

    // 显示散列表中的数据
    showDistro() {
        console.table(this.table)
    }

    // 将数据存入散列表
    put(data) {
        let pos = this.betterHash(data)
        if (this.table[pos]) {
            while(this.table[pos] !== undefined) {
                pos++
            }
        } 
        this.table[pos] = data
    }
}


// test
const names = ['David', 'Jennifer', 'Donnie', 'Hysunny', 'Raymond', 'Cynthia', 'Mike', 'Clayton', 'Danny', 'Jonathan']
const table = new HashTable()
names.forEach(item => {
    table.put(item)
})
table.showDistro()
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,772评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,458评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,610评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,640评论 1 276
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,657评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,590评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,962评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,631评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,870评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,611评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,704评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,386评论 4 319
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,969评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,944评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,179评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 44,742评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,440评论 2 342

推荐阅读更多精彩内容

  • 数据结构与算法--散列表 之前学习了基于链表的顺序查找、基于有序数组的二分查找、二叉查找树、红黑树,这些算法在查找...
    sunhaiyu阅读 646评论 3 5
  • 本文主要介绍散列表(Hash Table)这一常见数据结构的原理与实现。由于个人水平有限,文章中难免存在不准确或是...
    absfree阅读 16,277评论 2 35
  • 9.3.3 快速排序   快速排序将原数组划分为两个子数组,第一个子数组中元素小于等于某个边界值,第二个子数组中的...
    RichardJieChen阅读 1,832评论 0 3
  • 刘鑫的问题是她没有恶意,没有敌意,但也没有善意。江歌的问题是充满善意。 一个善良的人,不是他没有恶意,而是心存善意...
    托尼郭阅读 1,081评论 0 1
  • 早饭 大半个双层鸡腿汉堡 一个红糖馒头 牛奶 香菜炒青椒炒金枪鱼半碗 鸡蛋一只 加餐 20多个大连樱桃 吃到最后一...
    代码为剑阅读 159评论 0 0