求N个无序数组中第K(大/小)数的方法

思路一:时间复杂度为O(N*logk)

对前k个数,建立最大堆,对于后面N-k个数,依次和最大堆的最大数比较,如果小于最大数,则替换最大数,并重新建立最大堆。

堆排序:

我们举例,假若从10000万个数里选出前100个最大的数据。
首先我们先分析:既然要选出前100个最大的数据,我们就建立一个大小为100的堆(建堆时就按找最大堆的规则建立,即每一个根节点都大于它的子女节点),然后再将后面的剩余数据若符合要求就插入堆中,不符合就直接丢弃该数据。
那我们现在考虑:确定是该选择最大堆的数据结构还是最小堆的数据结构呢。
分析一下:
若选用最大堆的话,堆顶是堆的最大值,我们考虑既然要选出从10000万个数里选出前100个最大的数据,我们在建堆的时候,已经考虑了最大堆的特性,那这样的话最大的数据必然在它顶端。假若真不巧,我开始的前100个数据中已经有这10000个数据中的最大值了,那对于我后面剩余的10000-100的元素再想入堆是不是入不进去了!!!所以,选用最大堆从10000万个数里选出前100个最大的数据只能找出一个,而不是100个。
那如果选用最小堆的数据结构来解决,最顶端是最小值,再次遇到比它大的值,就可以入堆,入堆后重新调整堆,将小的值pass掉。这样我们就可以选出最大的前K个数据了。言外之意,假若我们要找出N个数据中最小的前k个数据,就要用最大堆了。
那如果选用最小堆的数据结构来解决,最顶端是最小值,再次遇到比它大的值,就可以入堆,入堆后重新调整堆,将小的值pass掉。这样我们就可以选出最大的前K个数据了。

时间复杂度:n*logk

一个堆的元素数目为K时,堆的高度至多为logk。建立堆的时间为klogk。而调整的次数为n-k,每次调整的时间为logk,所以调整的时间为 (n-k)logk,所以总的时间复杂度为nlogk。
n
logk = klogk + (n-k)logk

假若我们要找出N个数据中最大的前k个数据,就要用最小顶堆了。
假若我们要找出N个数据中最小的前k个数据,就要用最大顶堆了。

思路二:时间复杂度为O(k*n)

先排序前k个数,对于后面N-k个数,依次进行插入。
当k很小时,可以用这种算法

思路三:复杂度O(N*logN).

先直接排序,再取排序后数据的前k个数。
排序算法用最快的堆排序,复杂度也会达到O(N*logN).
当k接近于N时,可以用这种算法。

引自:https://blog.csdn.net/hanjing_1995/article/details/51539593
引自:http://www.cnblogs.com/studynote/

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 概述 排序有内部排序和外部排序,内部排序是数据记录在内存中进行排序,而外部排序是因排序的数据很大,一次不能容纳全部...
    蚁前阅读 5,215评论 0 52
  • 1.插入排序—直接插入排序(Straight Insertion Sort) 基本思想: 将一个记录插入到已排序好...
    依依玖玥阅读 1,271评论 0 2
  • 又是凌晨四点多,又是难熬的夜啊,听着辰在我旁边均匀的呼吸声加偶尔的呼噜声,更加难以入睡。孕期的各种不适症状又通通袭...
    云丶墨阅读 168评论 0 0
  • 大家知道由于某些原因,网络是被墙掉的,而electron的源地址是在国外,所以建议使用 淘宝镜像
    猪猪9527阅读 340评论 0 0
  • 一,统一返回数据结构 定义返回的数据结构 将返回数据包装成Rest风格实现ResponseBodyAdvice<T...
    垃圾简书_吃枣药丸阅读 10,528评论 11 44