分治--寻找第k小元素(元素可重复),复杂度O(n)

其他方法:

如果直接对序列排序求最小值,复杂度为nlogn;
如果直接套用快排的思想来做的话,最优情况为O(n),最坏为O(n2)


分治法的阈值:

我们有一种吊炸天的分治算法,可以用很好的效率求解出某个问题,分治算法当然在达到一个非常小的规模时,会能直接或用很简单的方法得出结论,但是,其实,问题规模在达到某个阈值的时候,用直接朴素的方法解决这个规模的问题的效率,已经比继续分治的算法高了。这个时候,我们在这个阈值就开始选择朴素的方法才是最明智的选择。


基本思路:

(1) 当规模小于阈值时,直接用排序算法返回结果。
(2) 当n大于阈值时,把n个元素划分为5个元素一组的n/5组,排除剩余元素(不会有影响,这里只是为了求中项mm),分别排序,然后挑出每一组元素的中间值,再在所有的中间值中,递归调用本算法,挑出中间值mm。
(3) 把元素划分为A1、A2、A3三组,分别包含小于、等于、大于mm的元素。
(4)分三种情况:

a.若A1的元素数量大于等于K,即第K个元素在第一组内:在A1中递归查找第k小元素。
b.若A1、A2元素个数之和大于等于K,即中项mm为第K个元素:返回mm
c.否则,第K个元素在第三组:在A3中递归寻找第(k-|A1、A2元素数量之和|)小元素。


伪代码:

输入  n 个元素的数组 A[1...n] 和整数 k,1 ≤ k ≤ n  
输出  A 中的第 k 小元素  
   
算法描述 select(A, low, high, k)  
1. n ← high - low + 1----(Θ(1))  
2. if  n < 44 then 将 A 排序 return (A[k])----(Θ(1))  
3. 令 q =  ⌊n/5⌋。将 A 分成 q 组,每组5个元素。如果5不整除 n ,则排除剩余的元素。----(Θ(n))  
4. 将 q 组中的每一组单独排序,找出中项。所有中项的集合为 M。----(Θ(n))  
5. mm ← select(M, 1, q,  ⌈q/2⌉)   { mm 为中项集合的中项 } ----T(n/5)  
6. 将 A[low...high] 分成三组----(Θ(n))  
    A1 = { a | a < mm }  
    A2 = { a | a = mm }  
    A3 = { a | a > mm }  
7. case  
    |A1| ≥ k : return select(A1, 1, |A1|, k)  
    |A1| + |A2| ≥ k : return mm  
    |A1| + |A2| < k : return select(A3, 1, |A3|, k - |A1| - |A2|)  
8. end case  

算法分析:

第1-6步的复杂度都很容易理解,我们着重讨论第7步的算法复杂度。

上图是处理到第5步后的元素,从左到右按各组中项升序排列,每组5个元素从下到上按升序排列。
我们需要知道的是第7步时候问题的规模,即A1、A3这两个数组的规模。
上图中我们可以看到W区的元素都是小于或等于mm的,令A1’表示小于或等于mm的元素的集合,显然W会是A1’的子集,即A1’的元素数量大于等于W的元素数量。
于是我们有下面这个式子:

A3的数量=n-A1’的数量,于是我们可以等到下面的式子:

由对称性,可得:

至此,我们知道A1、A3的上界是0.7n+1.2,步骤7耗费的时间是T(0.7n+1.2)。
到这里还没说到44阈值的由来,好,要开始说了。
我们希望去掉1.2这个常数,于是引入底函数帮忙:

这条式子什么时候成立呢?解不等式可得n>=44。
阈值44诞生了!!!
现在我们还有了算法运行时间的递推式:
可以算出来T(n)=Θ(n)。
对于求中项的题目也是同样的解法,就是找第(n+1)/2个元素(奇数)和第n/2、n/2+1个元素(偶数)。
需要注意,这个算法的常数倍数(比如c)都是很大的。


Java代码(未验证):

public static int select(int[] A, int k){  
        return selectDo(A, 0, A.length-1, k);  
    }  
  
private static int selectDo(int[] A, int low, int high, int k){  
    //select k min number  
    int p = high - low + 1;  
    if(p < 44){  
        Arrays.sort(A, low, high+1);  
        return A[low+k];  
    }  
    //A divided into q groups, each group 5 elements, and sort them  
    int q = p/5;  
    int[] M = new int[q];  
    for(int i = 0; i < q; i ++){  
        Arrays.sort(A, low + 5*i, low + 5*i + 5);  
        M[i] = A[low+5*i+2];  
    }  
    //select mid in M  
    int mid = selectDo(A, 0, q-1, (q-1)/2);  
    //A divided into 3 groups  
    int[] A1 = new int[p];  
    int[] A2 = new int[p];  
    int[] A3 = new int[p];  
    int count1, count2, count3;  
    count1 = count2 = count3 = 0;  
    for(int i = low; i <= high; i ++){  
        if(A[i] < mid)  
            A1[count1++] = A[i];  
        else if(A[i] == mid)  
            A2[count2++] = A[i];  
        else  
            A3[count3++] = A[i];  
    }  
    if(count1 >= k)  
        return selectDo(A1, 0, count1-1, k);  
    if(count1 + count2 >= k)  
        return mid;  
    return selectDo(A3, 0, count3-1, k-count1-count2);  
}  
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,875评论 6 496
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,569评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,475评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,459评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,537评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,563评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,580评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,326评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,773评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,086评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,252评论 1 343
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,921评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,566评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,190评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,435评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,129评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,125评论 2 352

推荐阅读更多精彩内容

  • 排序(下):如何用开排思想在O(n)内查找第K大元素 上一节我讲了冒泡排序、插入排序、选择排序这三种排序算法,它们...
    GhostintheCode阅读 820评论 0 0
  • 别人的成功与你有什么关系?自己没本事,一切只是白搭。 谁会无缘无故的帮你,世上没有免费的午餐,他们的成功能给自...
    不算爱阅读 182评论 0 0
  • 这两天评价大陆的台湾妹子突然就火了,大家都很嗨,一种昨天你对我爱理不理、今天我叫你高攀不起的得意感,各种台湾说大陆...
    银河谷浪哥阅读 931评论 0 0
  • 今天和素军教练一起去见大头教练和他的夫人重阳,感觉一见如故,有很多的话题可聊,彼此分享自己的志趣。这可能就是同频人...
    不明所以的蜗牛阅读 156评论 0 0
  • 看了阮一峰老师的《我的 2016 年》,深受感触,故此也来回顾一下本人的2016。 年初,不知哪根线搭错了,萌生了...
    TGCode阅读 775评论 7 22