BFPRT算法O(n)解决第k小的数

第k小算法

我们通常会简单地进行一个快速排序后,得到第k个位置上的数字即可。
我们都知道的是快速排序是个不稳定的排序,它的排序过程简单的理解主要是两个概念Partion,pivot(基准数)

一趟快速排序的过程如下

  1. 先从序列中选取一个数作为基准数
  2. 将比这个数大的数全部放到它的右边,把小于或者等于它的数全部放到它的左边

一趟快速排序也叫做Partion,即将序列划分为两部分,一部分比基准数小,另一部分比基准数大,然后
再进行分治过程,因为每一次Partion不一定都能保证划分得很均匀,所以最坏情况下的时间复杂度不能
保证总是O(nlogn)的。

BFPRT算法

BFPTR算法中,仅仅是改变了快速排序Partion中的pivot值的选取,在快速排序中,我们始终选择第一个元
素或者最后一个元素作为pivot,而在BFPTR算法中,每次选择五分中位数的中位数作为pivot,这样做的目的
就是使得划分比较合理,从而避免了最坏情况的发生。算法步骤如下

(1)将输入数组的n个元素划分为n/5组,每组5个元素,且至多只有一个组由剩下的n%5个元素组成。
(2)寻找n/5个组中每一个组的中位数,首先对每组的元素进行插入排序,然后从排序过的序列中选出中位数。
(3)对于(2)中找出的n/5个中位数,递归进行步骤(1)和(2),直到只剩下一个数即为这n/5个元素的中位数,找到中位数后并找到对应的下标p。
(4)进行Partion划分过程,Partion划分中的pivot元素下标为p。
(5)进行高低区判断即可。

本算法的最坏时间复杂度为O(n),值得注意的是通过BFPTR算法将数组按第K小(大)的元素划分为两部分,而
这高低两部分不一定是有序的,通常我们也不需要求出顺序,而只需要求出前K大的或者前K小的。

java代码示意

/**
 * Created by ganjun on 2017/5/3.
 */

import java.util.*;

public class BFPRT {
    public final int MAXN = 100000;

    public static void swap(int [] x , int i , int j){
        int tmp = x[i];
        x[i] = x[j]; x[j] = tmp;
    }

    public static void sort(int [] x , int l , int r){
        for(int i=l ; i<=r ; i++){
            for(int j=i+1 ; j<=r ; j++){
                if(x[j]<x[i]) swap(x , i , j);
            }
        }
    }

    public int findMedian(int []x , int l  , int r){
        int i , index;
        for(i=l , index=0 ; i+4<=r ; i+=5 , index++){
            sort(x , i , i+4);
            swap(x , l+index , i+2);
        }
        //处理5个一分组多余的数字
        if(i<=r){
            sort(x , i , r);
            swap(x , l+index , i+(r-i+1)/2);
            index++;
        }
        if(index == 1) return x[l+index];
        else return findMedian(x , l , l+index-1);
    }
    //寻找x数组中[l,r]区间内第k小元素
    public int findKthMin(int [] x , int l , int r , int k){
        int median = findMedian(x , l , r);
        // 类似快速排序的方式,确定一个pivot为这个中位数的值x[l],然后小的数放左边,大的数放右边
        // 填坑法,最开始的数字x[l]上l位置是空出来的,
        // 那么每一轮都从右边位置j找到一个较小的数填到i上(最开始i=l),然后i上空出来了位置,
        // 就再从左侧开始找到一个较大的数填回j上,直到i>=j
        int mediemVal = x[l];
        int i=l , j=r;
        while(i<j){
            while(i<j && x[j]>mediemVal) j--;
            if(i<j) x[i] = x[j];
            while(i<j && x[i]<mediemVal) i++;
            if(i<j) x[j] = x[i];
        }
        x[i] = mediemVal;
        if(i-l+1 == k) return x[i];
        else if(i-l+1 > k) return findKthMin(x , l , i-1 , k);
        else return findKthMin(x , i+1 , r , k-(i-l+1));
    }

    public static void main(String [] args){

        int []x = {2,3,6,5,7,9,4};
        BFPRT sol = new BFPRT();
        //int val = sol.findMidiem(x , 0 , 6);
        int val = sol.findKthMin(x , 0 , x.length-1 , 3);
        System.out.println(val);
    }
}

c++代码

#include <iostream>  
#include <string.h>  
#include <stdio.h>  
#include <time.h>  
#include <algorithm>  
   
using namespace std;  
const int N = 1000005;  
   
int a[N];  


int findMedian(int a[] , int l , int r)
{
    int i , index;
    for(i=l,index=0 ; i+4<=r ; i+=5,index++){
        sort(a+l , a+l+5);
        swap(a[l+index] , a[i+2]);
    }
    if(i<=r){
        sort(a+i , a+r+1);
        swap(a[l+index] , a[i+(r-i+1)/2]);
        index++;
    }
    if(index == 1) return a[l];
    else return findMedian(a , l , l+index-1);
}
//以p位置上的数字作为基准点划分,返回的i是最后基准点所在的位置
int partion(int a[] , int l , int r , int p)
{
    swap(a[p] , a[l]);
    int i=l , j=r , pivot= a[i];
    while(i<j){
        while(i<j && a[j]>=pivot) j--;
        if(i<j) a[i] = a[j];
        while(i<j && a[i]<=pivot) i++;
        if(i<j) a[j] = a[i];
    }
    a[i] = pivot;
    return i;
}   
//在a数组的[l,r]区间内找到第k小的数字
int findKthMin(int a[] , int l , int r , int k)
{
    int median = findMedian(a , l , r);
    int p = partion(a , l , r , l);
    int len = p-l+1;
    if(len == k) return a[p];
    else if(len>k) return findKthMin(a,l,p-1,k);
    else return findKthMin(a,p+1,r,k-len);
}
   
int main()  
{  
    int n, k;  
    while(~scanf("%d", &n)){  
        scanf("%d", &k); 
        for(int i = 0; i < n; i++)  
            scanf("%d", &a[i]);  
        int ret = findKthMin(a,0,n-1,k);
        //for(int i=0 ; i<n ; i++)
        printf("%d\n", ret);  
    }
    return 0;  
} 

>对于复杂度的理解有什么问题的可以参考《算法导论》9.3节,即112页
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 10,600评论 0 52
  • 概述:排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    每天刷两次牙阅读 9,092评论 0 15
  • Ba la la la ~ 读者朋友们,你们好啊,又到了冷锋时间,话不多说,发车! 1.冒泡排序(Bub...
    王饱饱阅读 5,779评论 0 7
  • 车灯闪动泪花 模糊出黑夜的轮廓 在陌生的匝道 在遥远的天桥 我看着城市里重影的建筑 在黑暗里听到黎明的哭泣
    王不烦阅读 2,372评论 0 1
  • 兔夫人阅读 1,477评论 0 0

友情链接更多精彩内容