[数据结构算法](一): 经典排序算法Python实现

一、冒泡排序 Bubble Sort

思想: 持续比较相邻元素,大的挪到后面,一次比较之后最后一个元素便是所有元素中最大的
步骤:

  1. 比较相邻的元素,如果第一个比第二个大,交换二者的位置,
  2. 对第0到第n-1个数据重复上述步骤,此时最大元素位于n-1处
  3. 每次对所有非排序元素(位于后面的元素)重复上述步骤,直到没有数字可以用来比较
def bubble_sort(array):
    n = len(array)
    for i in range(n):
        for j in range(1, n-i):
            if array[j-1] > array[j]: # if former larger than the latter, swap two elements
                array[j-1], array[j] = array[j], array[j-1] 
    return array

if __name__ == "__main__":
    array = [1,4,5,2,11,2,20,9]
    sorted_array = bubble_sort(array)
    print("after sort:\n", sorted_array)
    print("after sort:\n", array)

二、选择排序 Selection Sort
步骤:

  1. 遍历数组选择其中最小的元素放大数组第一个位置
  2. 在剩下了的元素中选择最小的元素放在第二个位置,直到没有剩下的元素
import time
import random

def selection_sort(array):

    n = len(array)
    for i in range(n):
        min_index = i # index for min element
        for j in range(i+1, n):
            if array[j] < array[min_index]:
                min_index = j
        array[min_index], array[i] = array[i], array[min_index] # swap the current element with the minium element
    return array

if __name__ == "__main__":

    n = 1000
    array = []
    for i in range(n):
        array.append(random.randint(0, n))
    sorted_array = selection_sort(array)

三、插入排序 Insertion Sort
原理: 对于每个未排序数据,在已排序序列中从后向前扫描,找到相应位置并插入
步骤:

  1. 去除第一个元素,该元素可以认为已经被排序
  2. 取出下一个元素,在已经排序的元素序列中从后向前扫描
  3. 如果被扫描的元素(已排序)大于新元素,将该元素后移一位
  4. 重复步骤3,直到找到已排序的元素小于或者等于新元素的位置
  5. 将新元素插入到该位置后
  6. 重复步骤2~5
import random
import time

def insertion_sort1(array):
    n = len(array)
    for i in range(n-1):
        temp = array[i+1]
        index = i
        for j in range(i, -1, -1):
            if array[j] > temp:
                array[j+1] = array[j]
                index = j
            else:
                break
            array[index] = temp
    return array

def insertion_sort2(array):
    n = len(array)
    for i in range(n-1):
        if array[i] > array[i+1]:
            temp = array[i+1]
            index = i
            for j in range(i, -1, -1):
                if array[j] > temp:
                    array[j+1] = array[j]
                    index = j
                else:
                    break
                array[index] = temp
    return array

if __name__ == "__main__":
    n = 1000
    array = []
    for i in range(n):
        array.append(random.randint(0, n))
    t0 = time.time()
    sorted_array1 = insertion_sort1(array)
    t1 = time.time()
    print("insertion_sort1 time:", t1 - t0)
    
    t0 = time.time()
    sorted_array2 = insertion_sort2(array)
    t1 = time.time()
    print("insertion_sort2 time:", t1 - t0)
    sorted_array = sorted(array, reverse=False) # ascending sorting
    assert(sorted_array2 == sorted_array1 == sorted_array)

四、归并排序 Merge Sort

思想: 归并排序是采用分治法的典型算法。先递归分解数组,再合并数组。

先考虑合并两个有序数组,基本思路是比较两个数组的最前面的数,谁小就先取谁,取了后相应的指针就往后移一位。然后再比较,直至一个数组为空,最后把另一个数组的剩余部分复制过来即可。

再考虑递归分解,基本思路是将数组分解成left和right,如果这两个数组内部数据是有序的,那么就可以用上面合并数组的方法将这两个数组合并排序。如何让这两个数组内部是有序的?可以再二分,直至分解出的小组只含有一个元素时为止,此时认为该小组内部已有序。然后合并排序相邻二个小组即可。

import time
import random


def merge_sort(array):
    if len(array) <= 1:
        return array
    mid = len(array) // 2
    left = merge_sort(array[:mid])
    right = merge_sort(array[mid:])
    return merge(left, right)

def merge(left, right):
    l = 0
    r = 0
    array = []
    while(l < len(left) and r < len(right)):
        if left[l] < right[r]:
            array.append(left[l])
            l += 1
        else:
            array.append(right[r])
            r += 1
    array += left[l:]
    array += right[r:]
    return array

if __name__ == "__main__":
    n = 10
    array = []
    for i in range(n):
        array.append(random.randint(0, n))
    print("Array to sorted:", array)
    merge_sorted_array = merge_sort(array)
    print("Merge Sorted array:", merge_sorted_array)
    sorted_array = sorted(array, reverse=False) # ascending sorting
    assert(merge_sorted_array == sorted_array)

五、快速排序 Quick Sort
思想:分而治之
步骤:

  1. 随机选取一个元素为基准元素
  2. 所有比基准元素小的置于基准元素左侧,所有比基准元素大的置于基准元素右侧
  3. 对基准元素左右区间递归调用此过程
import time
import random
def quick_sort(array):
    return qsort(array,0,len(array)-1)

def qsort(array,left,right):
    
    if left >= right : return array
    key = array[left]   # left as key for comparaing
    lp = left           # left index
    rp = right          # right index
    while lp < rp :
        while array[rp] >= key and lp < rp :
            rp -= 1
        while array[lp] <= key and lp < rp :
            lp += 1
        print(array[lp])
        array[lp],array[rp] = array[rp],array[lp]
        print("lp:{0}, rp:{1}".format(lp, rp))
        print(array)
    array[left],array[lp] = array[lp],array[left]
    qsort(array,left,lp-1)
    qsort(array,rp+1,right)
    return array


def quick_sort2(array):
    if len(array) <= 1:
        return array
    key = array[0]
    return quick_sort2([x for x in array[1:] if x < key]) + [key] + quick_sort2([x for x in array[1:] if x >= key])


if __name__ == "__main__":
    # n = 10
    # array = []
    # for i in range(n):
    #     array.append(random.randint(0, n))
    array = [6,5,3,1,8,7,2,4]
    print("Array to sorted:", array)
    quick_sorted_array = quick_sort(array)
    quick_sorted_array2 = quick_sort2(array)
    print("Quick Sorted array:", quick_sorted_array)
    sorted_array = sorted(array, reverse=False) # ascending sorting
    assert(quick_sorted_array == sorted_array == quick_sorted_array2)

六、堆排序
思想: 构建最大二叉堆,然后每次去除最大堆的根节点
步骤:

  1. 创建最大堆
  2. 移除位于根节点,做最大堆调整的运算

最主要在如何实现max_heapify()函数来调整最大堆上。
采取自底向上的方式构建最大堆,数组后半部分想象为堆最下面的节点,由于是单个节点故满足二叉堆定义。因此可以从中间节点向前逐步构建二叉堆。

下面这个图说明的很清楚了:

Screen Shot 2019-02-16 at 7.46.38 PM.png

# -*- coding: utf-8 -*-
import time
import heapq
import random

def heap_sort(array):
    n = len(array)
    first = n // 2 - 1  # the last non leaf node
    for start in range(first, -1, -1):
        print("enter")
        max_heapify(array, start, n-1)
    for end in range(n-1,0,-1):  # 堆排序,将大根堆转换成有序数组
        array[end],array[0] = array[0],array[end]
        max_heapify(array, 0, end-1)
    return array

def max_heapify(ary, start, end):
    """
    最大堆调整:将堆的末端子节点作调整,使得子节点永远小于父节点
    start为当前需要调整最大堆的位置,end为调整边界
    """
    root = start
    while True:
        print(root)
        child = root*2 + 1  # 调整节点的子节点 对于完全二叉树 左子节点为父节点的2*index + 1
        if child > end: break
        if child+1 <= end and ary[child] < ary[child+1] : # 如果右子节点大于左子节点
            child = child+1  # 取较大的子节点
        if ary[root] < ary[child]:  # 较大的子节点成为父节点
            ary[root], ary[child] = ary[child], ary[root]  # 交换
            root = child # 交换之后可能会破坏child子树的结构,child子树需要重新遍历
        else:
            break

def heap_sort2(array):
    h = []
    for i in array:
        heapq.heappush(h, i)
    return [heapq.heappop(h) for i in range(len(h))]

if __name__ == "__main__":
    n = 10
    array = []
    for i in range(n):
        array.append(random.randint(0, n))
    # array = [6,5,3,1,8,7,2,4]
    print("Array to sorted:", array)
    start = time.time()
    heap_sorted_array = heap_sort(array)
    end = time.time()
    print("Time for heap_sort:", end - start)
    start = time.time()
    heap_sorted_array2 = heap_sort2(array)
    end = time.time()
    print("Time for heap_sort using heapq:", end - start)
    # print("Heap Sorted array:", heap_sorted_array)
    # print("Heap Sorted array2:", heap_sorted_array2)
    sorted_array = sorted(array, reverse=False) # ascending sorting
    assert(heap_sorted_array == sorted_array)

七、计数排序
思想: 通过对元素进行计数,从而知道元素在已排序元素中应该处于什么位置
步骤:

  1. 定义计数数组,数组大小为代排序元素中最大元素
  2. 统计待排序数组中值为i元素的次数,每出现一次在计数数组的i处加一
  3. 对计数数组进行逐项求和,依次每一项的新值为原始值和它前一项的值之和,这一步是为了确定待排序数组的元素在新数组中的位置
  4. 将每个元素i放在新数组的C(i)处,每放一个元素C(i)减去1

如输入是:1, 4, 1, 2, 7, 5, 2
计数数组:

  index: 0, 1, 2, 3, 4, 5, 6, 7
  value: 0, 2, 2, 0, 1, 1, 0, 1

计数数组求和:

  index: 0, 1, 2, 3, 4, 5, 6, 7
  value: 0, 2, 4, 4, 5, 6, 6, 7

对于输入数组:1, 4, 1, 2, 7, 5, 2
1, 的index为1, 在新数组1处存1, 计数数组在1处减1:[0, 1, 4, 4, 5, 6, 6, 7]

[0, 1, 0, 0, 0, 0, 0, 0]

4, 的index为4, 在新数组5处存4, 计数数组在4处减1:[0, 1, 4, 4, 4, 6, 6, 7]

[0, 1, 0, 0, 0, 4, 0, 0]

...
最后得到:
1, 1, 2, 2, 4, 5, 7

def counting_sort(arr):
    max_num = max(arr)
    min_num = min(arr)
    output = [0 for _ in range(max_num+1)]
    count = [0 for _ in range(max_num+1)]
    for i in arr:
        count[i] += 1
    for i in range(1, max_num+1):
        count[i] += count[i-1]
    for i in arr:
        output[count[i]] = i
        count[i] -= 1
    return output[min_num:]
if __name__ == "__main__":
    arr = [1, 4, 1, 2, 7, 5, 2]
    print(counting_sort(arr))

八、基数排序
思想: 使用一定的基数把元素的位数按照重要性从小到大排序
步骤:
以常见的10为基数为列:
个位,十位,百位排序...
如:
170, 45, 75, 90, 802, 24, 2, 66
个位排序:
170, 90, 802, 2, 24, 45, 75, 66
十位:
802, 2, 24, 45, 66, 170, 75, 90
百位:
2, 24, 45, 66, 75, 90, 170, 802

"""
implementing counting sort algorithm
@author vincent
2019.2.16
"""

def counting_sort(arr, exp):
    n = len(arr)
    output = [0]*(n)
    count = [0]*(10)
    for i in range(0, n):
        index = arr[i] // exp
        count[index%10] += 1

    for i in range(1, 10):
        count[i] += count[i-1]

    i = n-1
    while i > 0:
        index = arr[i] / exp
        output[ count[ (index)%10 ] - 1] = arr[i]
        count[index%10] -= 1
        i -= 1
    for i in range(0, len(arr)):
        arr[i] = output[i]


def radix_sort(arr):
    max_num = max(arr)

    exp = 1
    while max_num/exp > 0:
        counting_sort(arr, exp)
        exp *= 10

if __name__ == "__main__":
    arr = [ 170, 45, 75, 90, 802, 24, 2, 66] 
    radix_sort(arr) 
    print(arr)
  • Todo:
    九、桶排序

Reference

  1. http://wuchong.me/blog/2014/02/09/algorithm-sort-summary/
  2. 常见算法可视化网站,有助于辅助理解: https://www.cs.usfca.edu/~galles/visualization/Algorithms.html
  3. Data Structures and Algorithms in Python GoodRich
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,185评论 6 503
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,652评论 3 393
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,524评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,339评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,387评论 6 391
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,287评论 1 301
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,130评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,985评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,420评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,617评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,779评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,477评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,088评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,716评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,857评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,876评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,700评论 2 354

推荐阅读更多精彩内容