算法:排序(二)

快速排序、归并排序、堆排序与希尔排序

该时期的算法可以达到O(N·logN)的时间复杂度,几乎已经是速度的极限了。快排和归并排序还使用了分治的思想,理解起来并不轻松。

快速排序

选择某元素作为哨兵并划分数组,使得大于和小于它的元素们分别集中在它的左右两侧,那么对它的左右两侧分别应用以上策略,直至排序结束。
该技术重点在于“划分”的过程。基本策略如下[注2]:

  1. 哨兵元素交换至队尾
  2. 定义一个“小于等于区间”(初始为空),当被处理元素小于等于哨兵元素时,与该区间右侧元素交换,并纳入到该区间内。(快排是不稳定算法,所以等于哨兵元素时怎么处理都无所谓)
  3. 哨兵元素与小于等于区间右侧元素交换。

CODE

int* quickSort(int* A, int n) {
    //整体是一个递归,指定递归的结束条件
    if(n<=1)
        return A;
    //在[0,n-1]间随机选择一个位置来交换至队尾
    int pos=rand()%n;
    swap(A[pos],A[n-1]);
    //小于等于区间的右边界,初始为-1
    int k=-1;
    for(int i=0;i<n-1;++i){
        //有没有等于无所谓
        if(A[i]<A[n-1]){
            //交换区间右侧元素,并扩展区间
            swap(A[k+1],A[i]);
            k++;
        }
    }
    //交换区间右侧元素,换回哨兵
    swap(A[k+1],A[n-1]);
    //分治子区间
    quickSort(A,k+1);
    quickSort(A+k+2,n-k-2);
    return A;
}

归并排序

归并排序基本上是分治和递归的最经典案例了。因为合并两个有序数组是比较容易的,所以如果对数组A进行排序,只需要排好A的前后两个子序列,然后合并这两个子序列即可。对A的子序列进行排序,用的同样是以上方法,这就是典型的“方法调用自身”的实现。
规划上,排序是从上而下的切分;实现上,排序是从下而上的整合。

CODE

//数组A的前m个数和后n个数都是有序的,合并它们
void merge(int* A,int m,int n){
    //开辟数组用于合并两个子序列的临时空间
    int* t=new int[m+n];
    int pos=0;
    //分别对序列计数
    int i=0,j=0;
    //两个子序列的首地址
    int* p=A,*q=A+m;
    //循环直至其中一个子序列遍历完成
    while(i<m && j<n){
        if(p[i]<q[j]){
            t[pos++]=p[i++];
        }else{
            t[pos++]=q[j++];
        }
    }
    //处理未遍历完的子序列
    while(i<m)
        t[pos++]=p[i++];
    while(j<n)
        t[pos++]=q[j++];
    //誊写回去原来的数组
    for(int i=0;i<m+n;++i)
        A[i]=t[i];
    delete[] t;
}
int* mergeSort(int* A, int n) {
    if(n>1){
        mergeSort(A,n/2);
        mergeSort(A+n/2,n-n/2);
        merge(A,n/2,n-n/2);
    }
    return A;
}

注意

  • 在函数中反复申请和释放堆内存会产生负担,建议使用全局数组来替代
  • 虽然有其他方法可以避免申请O(N)的内存,但是会产生额外时间花销

堆排序

堆排序借鉴了堆的结构,其核心算法在于大根堆的调整。
大根堆:所有根节点的值大于等于其左右子结点的值。
步骤:

  • 首先建立大根堆,方式是从底到顶的逐元素调整;
  • 每次交换堆顶(即最大值)与末尾元素,缩减堆的规模,并从堆顶做调整。循环此步骤至堆的规模为1。

大根堆的调整:待处理结点如果不是其左右孩子的最大值,则需要与最大值项进行交换,并沿着被交换项一路向下,直至不需交换或至叶节点为止。

CODE

int* heapSort(int* A, int n) {
    // 建立大根堆:从最后一个非叶节点开始。当然即使是叶节点也没关系
    for(int i=n/2-1;i>=0;--i)
        adjust(A,i,n);
    while(n>=1){
        //交换堆顶元素至队尾
        swap(A[0],A[n-1]);
        //缩小堆的规模,从堆顶元素调整堆
        adjust(A,0,n-1);
        n--;
    }
    return A;
}
//调整以数组A构建的大根堆的第i个结点
void adjust(int* A,int i,int n){
    //最大项暂定为i
    int max=i;
    //如果左结点存在且大于当前最大项
    if(2*i+1<n && A[2*i+1]>A[i]){
        max=2*i+1;
    }
    //如果右结点存在且大于当前最大项
    if(2*i+2<n && A[2*i+2]>A[max]){
        max=2*i+2;
    }
    //如果需要交换,则沿着被交换项进行递归调用
    if(max!=i){
        swap(A[max],A[i]);
        adjust(A,max,n);
    }
}

注意

  • 堆排序的主要思想在于每一步的调整后,都可以维持大根堆的结构,下一步的调整就可以依靠大根堆的结构在O(logN)的时间内完成。

希尔排序

希尔排序是从插入排序进化来的算法,其出发点是:对于一个近乎有序的序列,插入排序的效率非常高。所以希尔排序使用较大的步长来模仿插入排序(后者步长为1),从而很快地对序列梳理至近乎有序的程度。
插入排序可以视作步长为1的希尔排序。


CODE

int* shellSort(int* A, int n) {
    for (int gap = n / 2; gap > 0; gap /= 2) //步长  
        for (int i =  gap; i < n; ++i){
            int get=A[i];
            int j=i-gap;
            while(j >= 0 && A[j] > get){  
                A[j + gap] = A[j];  
                j -= gap;  
            }
            A[j + gap] = get; 
        }
        return A;
}

对比插入排序:

int* shellSort(int* A, int n) {
    for (int gap = n/2; gap>0; gap /= 2)     //  [空]
        for (int i =  gap; i < n; ++i){      //  for (int i =  1; i < n; ++i){
            int get=A[i];                    //      int get=A[i];
            int j=i-gap;                     //      int j=i-1;
            while(j >= 0 && A[j] > get){     //      while(j>=0 && A[j]>get){
                A[j + gap] = A[j];           //            A[j+1]=A[j];
                j -= gap;                    //            j--;
            }                                //      }
            A[j + gap] = get;                //      A[j+1]=get;
        }                                    //  {
    return A;
}

差异仅仅在于去掉了最外层的gap循环,然后gap取值为1.

附注

[2]早期的快排提供了另一种划分思路:
哨兵元素换到队尾,创建指针i和指针j分别指向首尾,并逐步向中间靠拢,指针i找到一个大于等于基准的元素,等待j指针找到一个小于等于基准的元素,两者交换。直到两指针相遇,换回哨兵元素。
然而这个过程看似简单,实则杀机四伏:

int* quickSort(int* A, int n) {
    if(n<=1)
        return A;
    int pos=rand()%n;
    swap(A[pos],A[n-1]);
    //j指向A[n-1]而不是A[n-2],否则在长度为2的数组中可能出错
    int i=0,j=n-1;
    //循环条件:i<j,这样在终止时i==j且i指向第一个大于哨兵的元素
    while(i<j){
        //A[i]=A[n-1]可以避免相等元素卡死的情况
        while(i<j && A[i]<=A[n-1])
            i++;
        //A[j]=A[n-1]可以避免相等元素卡死的情况
        while(i<j && A[j]>=A[n-1])
            j--;
        //i和j的调整顺序不要相反!
        if(i<j)
            swap(A[i],A[j]);
    }
    //终止时i==j且i指向第一个大于哨兵的元素
    swap(A[i],A[n-1]);
    //递归
    quickSort(A,i);
    quickSort(A+i+1,n-i-1);
    return A;
}
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342

推荐阅读更多精彩内容

  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 3,726评论 0 15
  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 5,164评论 0 52
  • 概述排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部的...
    Luc_阅读 2,253评论 0 35
  • 1.插入排序—直接插入排序(Straight Insertion Sort) 基本思想: 将一个记录插入到已排序好...
    依依玖玥阅读 1,235评论 0 2
  • POR学习法指的是以Plan(计划)、Output(输出)、Review(复盘)为循环的学习法。又称“极舒服(计输...
    Noah_e81e阅读 1,859评论 1 4