堆排序及优先队列

堆:一种数据结构,有最大堆和最小堆两种类型,实质上是一个完全二叉树,如果是最大堆,则父节点上的值比子节点上的值大,反之则是最小堆。

ps:这里提及的堆与常说的堆内存区域的堆不一样,此处提及的堆是一种简单的数据结构,而堆内存的实现较复杂。

堆排序:堆排序是一种比较高效的排序方式,时间效率为N*lgN,它利用最大堆的特性完成排序

本人之前的博文中有提到归并排序,与堆排序相比,二者效率相同,但堆排序还有个最大的好处就是,它比较省空间,在归并排序中需要申请额外左右数组空间,内存占用空间大。

堆排序分为三个步骤:

  • 创建最大堆
  • 确保最大堆中父节点的值比子节点的值都大
  • 将根节点与最后一个叶子节点比较,择其大者剔除出堆,再重复第2、3步。

第二步是整个堆排序的关键。

public static void maxHeapify(int[] array, int heapsize, int i){
    int l = 2*i + 1;
    int r = 2*i + 2;
    int large = i;
    if (l < heapsize && array[i] < array[l]) {
        large = l;
    }else {
        large = i;
    }
    if (r < heapsize && array[large] < array[r]) {
        large = r;
    }
    if (large != i) {
        int temp = array[i];
        array[i] = array[large];
        array[large] = temp;
        //因为将最大值和父节点交换了位置,新的子节点并不能保证一定是比它的子节点大
        //所以需要递归,确定交换的子节点比它的子节点都大
        //而没有动的子节点是不需要进行递归的,因为它的数值没有变,如果之前满足最大堆条件,现在就还是满足的
        maxHeapify(array, heapsize, large);
    }
}

maxHeapify过程并不复杂,注意到函数中有参数heapsize,本例中的堆其实是基于数组的,堆大小并不一定等于数组长度的,因为在堆排序的第三步中需要将堆的根节点剔除出堆,所以堆的长度一直在变。

创建最大堆过程:

  public static void buildMaxHeap(int[] array){
    int heapsize = array.length;
    for (int i = heapsize/2; i >= 0; i--) {
        maxHeapify(array,heapsize,i);
    }
}

buildMaxHeap过程,有两点需要注意。

  • 堆其实是一个完全二叉树,且是以数组实现的,那么二叉树中i节点的左子节点一定是2i + 1,右子节点一定是2i + 2,对应在数组中 array.length/2 到 array.length - 1之间的节点,肯定是叶子节点,没有子节点,因为如果有子节点,则子节点的索引已经大于数组长度了,所以不可能出现。
  • 创建堆必须逆序,即必须先确认完全二叉树底层的节点具有最大堆的性质,父节点必须大于子节点,然后再逐层往上,最后才确保根结点具有最大堆性质才行。如果遍历是从0开始,那么整个完全二叉树将不具有最大堆性质。

buildMaxHeap后,完全二叉树中的根结点就一定是整个数组中最大的(因为父节点一定大于子结点的性质)。注意,只能保证根结点的值是最大的,最下方的最后的子结点,则并不一定是最小的值。

heapSort过程,因为知道根结点一定是最大的,所以可以将根结点和数组中最后一位相比较,交换二者的值,然后再将数组中最后一位剔除出堆(此时,数组中最后一位已经是最大值了),再重新确保最大堆特性,持续这个过程,即将完全堆排序。

  public static void heapSort(int[] array){
    int heapsize = array.length;
    for (int i = heapsize - 1; i > 0; i--) {
        if (array[i] < array[0]) {
            int temp = array[0];
            array[0] = array[i];
            array[i] = temp;
            heapsize --;
            maxHeapify(array, heapsize, 0);
        }
    }
}

测试代码:

  public static void main(String[] args) {
    int[] array = {4,1,3,2,16,9,10,14,8,7,5};
    buildMaxHeap(array);
    print(array);
    heapSort(array);
    print(array);
}

堆排序的时间效率计算较为复杂,主要是其中牵涉到递归。一般而言,算法的时间效率仅考虑最差极值情况。maxHeapify过程,根结点的值最小,那么需要将根结点的值一直往树的下层挪,最后根结点的值将变成叶子结点的值,那么挪动的距离则为二叉树的高度,于是maxHeapify的效率与二叉树的高度相关,二叉树的高度为lgN,那么maxHeapify的效率为lgN,在heapSort过程中,遍历N次,每次效率均为lgN,那么整个排序算法的效率为N*lgN。
ps:以上是本人的简单推测算法,详细推算请参考算法导论。

优先队列是一种用来维护由一组元素构成的集合S的数据结构,内部数据排序位置由元素本身决定,通常优先队列首位数据是集合中最大的或最小的一位。

优先队列中首位数据是最大值,则称为最大优先队列。
最大优先队列只是首位最大,并不保证队列中均是由大到小顺序排列。如果是以数组实现,则可保证,但此处是以堆实现,则不能确保从大到小排列,只能保证首位值最大。

优先队列有常见三个操作:

  • 获取最大值
  • 获取最大值并将值删除出堆
  • 更改某个位置值大小

heapMaxNum过程非常简单:

  public static int heapMaxNum(int[] array){
    return array[0];
  }

heapExtractMax:

  public static int heapExtractMax(int[] array){
    if (array.length == 0) {
        System.out.println("heap is empty");
    }
    int i = array.length - 1;
    int max = array[0];
    array[0] = array[i];
    maxHeapify(array, array.length - 1, 0);
    return max;
}

heapExtractMax过程,取出最大值,然后将堆中最后一位放到首位,再执行maxHeapify,检查最大堆性质。

heapIncreaseKey:

  public static void heapIncreaseKey(int[] array, int i, int key){
    if (key < array[i]) {
        System.out.println("the key is small than origin");
        return;
    }
    array[i] = key;
    int parent = getParent(i);
    while (parent != Integer.MIN_VALUE && array[i] > array[parent]) {
        int temp = array[i];
        array[i] = array[parent];
        array[parent] = temp;
        i = parent;
        parent = getParent(parent);
    }
}

heapIncreaseKey过程,需要将当前值与父节点比较,如果大于父节点则交换位置,再从当前父节点往上,循环此过程。

因为父节点一定大于原节点,所以并不需要从原节点再往下循环,确保最大堆性质了。

根据完全二叉树性质,获取父节点代码如下:

  public static int getParent(int i){
    if (i == 0) {
        return Integer.MIN_VALUE;
    }else {
        if (i%2 == 0) {
            return (i-1)/2;
        }else {
            return i/2;
        }
    }
}

使用堆实现优先队列比用纯数组实现更高效,纯数组因为需要保证从大到小排列,则插入效率为N,而堆插入效率为N*lgN

ps:堆一定包含非常重要的属性,堆长度,本例中仅使用数组简单实现。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 204,732评论 6 478
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 87,496评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 151,264评论 0 338
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,807评论 1 277
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,806评论 5 368
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,675评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 38,029评论 3 399
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,683评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 41,704评论 1 299
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,666评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,773评论 1 332
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,413评论 4 321
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 39,016评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,978评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,204评论 1 260
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 45,083评论 2 350
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,503评论 2 343

推荐阅读更多精彩内容

  • 0.目录 1.优先队列ADT 2.几种实现 3.二叉堆 4.d-堆 5.左式堆 6.斜堆 7.二项队列 8.斐波那...
    王侦阅读 3,047评论 1 2
  • 第一章 绪论 什么是数据结构? 数据结构的定义:数据结构是相互之间存在一种或多种特定关系的数据元素的集合。 第二章...
    SeanCheney阅读 5,740评论 0 19
  • 目录 1.各种表的对比参考基本数据结构ADT及其实现1.1 三种表1.2 表的两种实现(数组、链表)之间的对比1....
    王侦阅读 15,224评论 0 11
  • 四. 走向世界之巅——快速排序 你可能会以为归并排序是最强的算法了,其实不然。回想一下,归并的时间效率虽然高,但空...
    Leesper阅读 1,612评论 9 7
  • 1 序 2016年6月25日夜,帝都,天下着大雨,拖着行李箱和同学在校门口照了最后一张合照,搬离寝室打车去了提前租...
    RichardJieChen阅读 5,073评论 0 12