Python数据结构与算法48:排序与查找:归并排序

:本文如涉及到代码,均经过Python 3.7实际运行检验,保证其严谨性。

本文阅读时间约为5分钟

前面介绍过分治策略,下面看看分治策略在排序中的一个应用——归并排序(Merge Sort)。

归并排序(Merge Sort)

归并排序就是递归算法,思路是,将需要排序的数据表持续分裂为两半,对两半分别进行归并排序。其套用递归三定律如下:

  • 基本结束条件——数据表仅有1个数据项。这种情况就已经是排好序的。
  • 缩小规模——将数据表分裂为相等的两半,规模减为原来的1/2。
  • 调用自身——将两半分别调用自身排序,然后将分别排好序的两半进行归并,得到排好序的数据表。

归并排序的参考代码如下:

# 归并排序v1。

def mergeSort(alist):
#    print(f'Splitting {alist}')
    if len(alist) > 1:  # 基本结束条件。
        mid = len(alist) // 2
        lefthalf = alist[:mid]
        righthalf = alist[mid:]
        
        # 递归调用。
        mergeSort(lefthalf)  # 对左半部进行排序。
        mergeSort(righthalf)  # 对右半部进行排序。
        
        i = j = k = 0
        
        # 拉链式交错把左右半部从小到大归并到结果列表中。
        while i < len(lefthalf) and j < len(righthalf):
            if lefthalf[i] < righthalf[j]:
                alist[k] = lefthalf[i]
                i += 1
            else:
                alist[k] = righthalf[j]
                j += 1
            k += 1
        
        # 归并左半部剩余项。
        while i < len(lefthalf):
            alist[k] = lefthalf[i]
            i += 1
            k += 1
        
        
        # 归并右半部剩余项。
        while j < len(righthalf):
            alist[k] = righthalf[j]
            j += 1
            k += 1
        
        print(f'Merging {alist}')


l = [3, 0, 2, 9, 6, 5, 23, 15]   
# 排序之后应为:[0, 2, 3, 5, 6, 9, 15, 23]。 

mergeSort(l)

<<<
Merging [0, 3]
Merging [2, 9]
Merging [0, 2, 3, 9]
Merging [5, 6]
Merging [15, 23]

上述代码对于Python来说,不怎么符合Python简洁优雅的特性,也就是不那么Pythonic。

实际上,有一种更为Pythonic的代码如下:

# 归并排序v2。

def merge_sort(lst):
    # 递归结束条件。
    if len(lst) <= 1:
        return lst
    
    # 分解问题,并递归调用。
    middle = len(lst) // 2
    left = merge_sort(lst[:middle])  # 左半部排序。
    right = merge_sort(lst[middle:])  # 右半部排序。
    
    # 合并左右半部,完成排序。
    merged = []
    while left and right:
        if left[0] <= right[0]:
            merged.append(left.pop(0))
        else:
            merged.append(right.pop(0))
    
    merged.extend(right if right else left)
    return merged
    

l = [3, 0, 2, 9, 6, 5, 23, 15]   
# 排序之后应为:[0, 2, 3, 5, 6, 9, 15, 23]。 

print(merge_sort(l))

<<<[0, 2, 3, 5, 6, 9, 15, 23]
归并排序的算法分析

将归并排序分为两个过程进行分析:分裂归并

  • 分裂的过程,借鉴二分查找中的分析结果,是对数复杂度,即时间复杂度为O(logn)。
  • 归并的过程,相对于分裂的每个部分,其所有数据项都会被比较和放置一次,所以是线性复杂度,即其时间复杂度为O(n)。

考虑到每次分裂的部分都进行一次O(n)的数据项归并,总的时间复杂度为O(nlogn)。

最后,我们注意到算法中有两个切片操作。

但是,我们可以通过取消切片操作,改为传递两个分裂部分的起始点和终止点。更改之后仍然是可行的,只是算法可读性会稍微差一点。

我们注意到归并排序算法使用了额外1倍的存储空间用于归并。这是归并的劣势,对特大数据集进行排序时需要考虑进去。

To be continued.

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容