桶排序和计数排序
桶排序
在说计数排序之前需要先提一下桶排序,因为计数排序实际上可以被认为是一种特殊的桶排序。
桶排序,顾名思义,需要准备很多桶,比如在一次数学考试过后,需要给同学们按成绩高低排个序,学生人数是56,成绩最低为0分,满分为120。
我们就可以准备6个桶:A、B、C、D、E、F,每个桶存放不同区段的成绩。
F桶:0~20
E桶:21~40
D桶:41~60
C桶:61~80
B桶:81~100
A桶:101~120
遍历一遍数据将成绩放入不同的桶里面之后,再对每个桶里面的数据进行快速排序,然后将排好序的数据按FEDCBA的顺序合在一起。
桶排序时间复杂度分析
- 遍历一次,将数据放入对应的桶中,
- 假设数据分散比较均匀,被分到k个桶中,每个桶中数据大概是
- 每个桶内的快速排序为
- 综合一下,桶排序的时间复杂度是
- 当k无限趋近与n的时候,
无限等于1,此时桶排序的时间复杂度是O(n)
计数排序
计数排序可以认为就是一种特殊的桶排序,特殊在哪儿呢?计数排序的桶个数和要排序的数据的范围一致,比如上面数据考试成绩排序的问题,计数排序的思想就是根据范围0~120来建立121个桶,将数据分布在121个桶。因为每个桶内的数据是相等的,这样就不用再进行桶内排序了,直接按桶顺序合起来就可以了。
计数排序代码实现
"""
计数排序
Author: xingrui
"""
# 最大值
def maxNum(nums: list):
maxNumber = nums[0]
for number in nums[1:]:
if maxNumber < number:
maxNumber = number
return maxNumber
# 计数排序
def countSort(nums: list):
maxNumber = maxNum(nums)
# 初始化数组大小
countArray = [0] * (maxNumber + 1)
# 将原始数组的每个元素出现次数放到countArray中计数
for number in nums:
countArray[number] += 1
# 累加countArray中的元素,得出在最后结果中的位置关系
for i, item in enumerate(countArray):
if i == 0:
continue
else:
countArray[i] += countArray[i - 1]
result = [0] * len(nums)
for item in nums[::-1]:
countArray[item] -= 1
index = countArray[item]
result[index] = item
return result
if __name__ == "__main__":
nums = [2, 3, 1, 3, 0, 5, 4, 2]
print(countSort(nums))
基数排序
基数排序
基数排序适用的情景比较特殊,需要数据本身是有层次的,比如对单词进行排序,对手机号进行排序,排序的时候会将每个手机号同一个位置的字符拿出来用计数排序或者桶排序来排序。
代码实现
"""
基数排序
Author: xingrui
"""
# 最大值
def maxLength(words: list) -> int:
length = len(words[0])
for word in words[1:]:
if length < len(word):
length = len(word)
return length
# 自动补全
def autoComplete(words: list, length: int):
for i, item in enumerate(words):
if len(item) < length:
words[i] = item + "".join(["0"] * (length - len(item)))
# 基数排序
def radixSort(words: list):
length = maxLength(words)
autoComplete(words, length)
for index in range(length - 1, -1, -1):
countSort(words, index)
for i, word in enumerate(words):
words[i] = str(word).strip("0")
# 计数排序
def countSort(words: list, index: int):
# 初始化数组大小,ASCII中小写字母z对应的数字是122
countArray = [0] * 123
# 将原始数组的每个元素出现次数放到countArray中计数
for word in words:
letter = word[index]
countArray[ord(letter)] += 1
# 累加countArray中的元素,得出在最后结果中的位置关系
for i, item in enumerate(countArray):
if i == 0:
continue
else:
countArray[i] += countArray[i - 1]
result = [0] * len(words)
for item in words[::-1]:
letter = item[index]
ascii = ord(letter)
countArray[ascii] -= 1
result[countArray[ascii]] = item
if __name__ == "__main__":
words = ["admin", "activity", "birdcage", "heel", "cushion", "fruit",
"background", "bride", "horse", "zebra", "juice", "bridegroom"]
radixSort(words)
print(words)
参考
https://www.jianshu.com/p/28ed6963276c
https://www.jianshu.com/p/0aff57aa5f8d
https://www.jianshu.com/p/be8842b1e5dc