求N个无序数组中第K(大/小)数的方法

思路一：时间复杂度为O(N*logk)

对前k个数，建立最大堆，对于后面N-k个数，依次和最大堆的最大数比较，如果小于最大数，则替换最大数，并重新建立最大堆。

堆排序：

我们举例，假若从10000万个数里选出前100个最大的数据。
首先我们先分析：既然要选出前100个最大的数据，我们就建立一个大小为100的堆（建堆时就按找最大堆的规则建立，即每一个根节点都大于它的子女节点），然后再将后面的剩余数据若符合要求就插入堆中，不符合就直接丢弃该数据。
那我们现在考虑：确定是该选择最大堆的数据结构还是最小堆的数据结构呢。
分析一下：
若选用最大堆的话，堆顶是堆的最大值，我们考虑既然要选出从10000万个数里选出前100个最大的数据，我们在建堆的时候，已经考虑了最大堆的特性，那这样的话最大的数据必然在它顶端。假若真不巧，我开始的前100个数据中已经有这10000个数据中的最大值了，那对于我后面剩余的10000-100的元素再想入堆是不是入不进去了！！！所以，选用最大堆从10000万个数里选出前100个最大的数据只能找出一个，而不是100个。
那如果选用最小堆的数据结构来解决，最顶端是最小值，再次遇到比它大的值，就可以入堆，入堆后重新调整堆，将小的值pass掉。这样我们就可以选出最大的前K个数据了。言外之意，假若我们要找出N个数据中最小的前k个数据，就要用最大堆了。
那如果选用最小堆的数据结构来解决，最顶端是最小值，再次遇到比它大的值，就可以入堆，入堆后重新调整堆，将小的值pass掉。这样我们就可以选出最大的前K个数据了。

时间复杂度：n*logk

一个堆的元素数目为K时，堆的高度至多为logk。建立堆的时间为klogk。而调整的次数为n-k，每次调整的时间为logk，所以调整的时间为 (n-k)logk，所以总的时间复杂度为nlogk。
nlogk = klogk + (n-k)logk

假若我们要找出N个数据中最大的前k个数据，就要用最小顶堆了。
假若我们要找出N个数据中最小的前k个数据，就要用最大顶堆了。

思路二：时间复杂度为O(k*n)

先排序前k个数，对于后面N-k个数，依次进行插入。
当k很小时，可以用这种算法

思路三：复杂度O(N*logN).

先直接排序，再取排序后数据的前k个数。
排序算法用最快的堆排序，复杂度也会达到O(N*logN).
当k接近于N时，可以用这种算法。

引自：https://blog.csdn.net/hanjing_1995/article/details/51539593
引自：http://www.cnblogs.com/studynote/

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

求N个无序数组中第K(大/小)数的方法

求N个无序数组中第K(大/小)数的方法

思路一：时间复杂度为O(N*logk)

堆排序：

时间复杂度：n*logk

思路二：时间复杂度为O(k*n)

思路三：复杂度O(N*logN).

相关阅读更多精彩内容

友情链接更多精彩内容