排序算法(3)- 桶排序、计数排序、基数排序

桶排序(Bucket sort)

将要排序的数据分到几个有序的桶里,每个桶里面再单独进行排序,最后把每个桶里的数据依次取出来,组成的序列就是有序序列。

看问题

对一组金额在0-50之间的订单进行排序:22,5,11,41,45,26,29,10,7,8,30,27,42,43,40

我们按0-9,10-19,20-29,30-39,40-49分5个桶,这样每个桶的数据就是[5,7,8],[10,11],[22,26,27,29],[30],[40,41,42,43,45]

分别对桶内数据排序,再取出即可。

如果要排序的数据有n个,把它们均匀地划分到m个桶内,每个桶里有k=n/m个元素,每个桶内部使用快速排序,时间复杂度为o(klogk)。m个桶排序复杂度就是O(mklogk),因为k=n/m,所以整个桶排序的时间复杂度就是O(nlog(n/m))。当桶的个数接近数据个数n时,log(n/m)就是一个非常小的常量,这个时候桶排序时间复杂度接近O(n)。

计数排序(Counting sort)

如果排序的数据范围不大的话,例如查询高考分数,分数只可能是0780分,或者查询年龄1120岁这样的话,那么就可以分成781个桶或者120个桶,只需要扫描遍历即可,所以时间复杂度是O(n)。

关键点在于"计数"

假设有8个考生,分数范围在0~5分之间,分别是:2,5,3,0,2,3,0,3,放在数组A[8]中

A[8] 2 5 3 0 2 3 0 3

以考生成绩作为下标,就能得到一个C[6]的桶,我们用这个桶来存储对应分数的考生个数,得到如下的数据:

C[6] 2 0 2 3 0 1
下标 0 1 2 3 4 5

这时对数组顺序求和:

C[6] 2 2 4 7 7 8
下标 0 1 2 3 4 5

接下来是怎么计算出每个考生在有序数组中对应的位置

我们从后到前一次扫描A[8],当扫描倒数第一个3时,查找数组C中下标3对应的数字是7,说明分数小于等于3的考生个数是7,当前数字3就是7个考生里面的最后一个,那就可以把3放进数组R[8]的对应下标6的位置。

R[8] 3
下标 0 1 2 3 4 5 6 7

同时,C[6]中3对应的个数-1

C[6] 2 2 4 6 7 8
下标 0 1 2 3 4 5

加下来是0,对应的是2,则在R[8]中下标为1

R[8] 0 3
下标 0 1 2 3 4 5 6 7

c[0] = c[0] - 1

C[6] 1 2 4 6 7 8
下标 0 1 2 3 4 5

按这样的规律最后数组R内的数据就是从小到达有序排列。

下面是代码描述

def counting_sort(array):
    n = len(array)
    if n <= 1:
        return
    
    max = array[0]
    for item in array:
        if max < item:
            max = item
    
    countArray = []
    for i in range(0, max+1):
        countArray.append(0)

    # 计算每个元素的个数,放入C中
    for i in array:
        countArray[i] += 1

    count = len(countArray)

    # 依次累加    
    for i in range(1, count):
        countArray[i] = countArray[i-1] + countArray[i]
    
    resultArray = [0] * n
    for i in range(n-1, -1, -1):
        index = array[i]
        count = countArray[index]
        resultArray[count-1] = index
        countArray[index] = count-1

    for i in range(0, n):
        array[i] = resultArray[i]


if __name__ == "__main__":
    arr = [2, 5, 3, 0, 2, 3, 0, 3]
    counting_sort(arr)
    print(arr)

总结一下,在数据范围不大的场景中,可以使用计数排序,而且计数排序只能给非负整数排序,如果存在负数或小数情况,可以考虑手动调整到正整数范围内。

基数排序(Radix sort)

看问题

假设有10万个手机号码,怎么比较快速的从小到达排序?

用快排可以做到O(nlogn),用上面的桶排序和计数排序范围太大了不适合,这时候就要用到基数排序。

手机号码有11位,a、b两个手机号,如果a的第一位就比b大,那后面就不用比较了。
我们先按照最后一位来排序手机号码,然后再按倒数第二位排序,以此类推,经过11次排序后,手机号码就都有序了。

根据每一位来排序,用桶排序或者计数排序,时间复杂度可以做到O(n),如果要排序的数据有k位,总的时间复杂度是O(kn),当k不大的时候,近似于O(n)。

如果排序的数据位数不是等长的,可以先把他们补齐,再排序。

总结基数排序就是可以把数据按来比较,且每一位是递进关系。此外每一位的范围不能太大。

来自 https://leejnull.github.io/2020/03/02/2020-03-02-01/

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,271评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,275评论 2 380
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,151评论 0 336
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,550评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,553评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,559评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,924评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,580评论 0 257
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,826评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,578评论 2 320
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,661评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,363评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,940评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,926评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,156评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,872评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,391评论 2 342

推荐阅读更多精彩内容