说明:该系列博客整理自《算法导论(原书第二版)》,但更偏重于实用,所以晦涩偏理论的内容未整理,请见谅。另外本人能力有限,如有问题,恳请指正!
虽然堆排序算法是一个很漂亮的算法,但在实际中,快速排序的一个好的实现往往优于堆排序。尽管这样,堆数据结构还是有着很大的用处,在这一节中我们要介绍堆的一个很常见的应用:作为高效的优先级队列。如堆一样,队列也有两种:最大优先级队列和最小优先级队列。这里将集中讨论基于最大堆实现的最大优先级队列。
优先级队列 是一种用来维护由一组元素构成的集合 S 的数据结构,这一组元素中的每一个都有一个关键字 key 。一个 最大优先级队列 支持以下操作:
1)、INSERT(S, x) :把元素 x 插入集合。
2)、MAXIMUM(S) :返回 S 中具有最大关键字的元素。
3)、EXTRACT-MAX(S) :去掉并返回 S 中具有最大关键字的元素。
4)、INCREASE-KEY(S, x, k) :将元素 x 的关键字值增加到 k ,这里 k 值不能小于 x 的原关键字值。
最大优先级队列的一个应用是在一台分时计算机上进行作业调度。这种队列对 “要执行的各作业及它们之间的相对优先关系” 加以记录。 当一个作业做完或中断时,用EXTRACT-MAX操作从所有等待作业中,选择出具有最高优先级的作业。在任何时候一个新作业都可以用INCREASE-KEY加入到队列中去。
最小优先级队列 支持的操作包括 INSERT , MINIMUM , EXTRACT-MIN , DECREASE-KEY 。这种队列可被用在基于事件驱动的模拟器中(事件一般是按时间排序的),在这种应用中队列中的元素是要模拟的事件,每一个元素(事件)都有一个发生时间作为其关键字。事件模拟要按照各事件发生的顺序进行,因为模拟某一事件可能导致稍后对其他事件的模拟。模拟程序每一步都使用EXTRACT-MIN来选择下一个模拟的事件。当一个新事件产生时,使用INSERT将其放入队列中。
优先级队列可以用堆来实现。在一个给定的,诸如作业调度或事件驱动的模拟应用中,优先级队列的元素对应着应用中的对象。通常,我们需要确定一个给定的队列中元素所对应的应用对象,反之亦然。当用堆实现优先级队列时,需要在堆中的每个元素里存储对应的应用对象的柄(handle),对象柄的准确含义取决于具体的应用,可以是指针,也可以是一个整型数;同样的,我们需要将堆中元素的柄存储到其对应的应用对象中。本节中对象柄用数组下标表示。
下面是最大优先级队列的操作。
1)、HEAP-MAXIMUM过程:返回 S 中具有最大关键字的元素。时间复杂度为 Θ (1)。
HEAP-MAXIMUM(A)
return A[1]
2)、HEAP-EXTRACT-MAX 过程:去掉并返回 S 中具有最大关键字的元素。时间复杂度为O (lg n )。堆中元素key增大后,只有父级元素的key可能大于增大后元素的key,所以如果父级元素的key小于增大后元素的key,则逐级后移即可保证堆的性质。
HEAP-EXTRACT-MAX(A)
if A.heap-size < 1
error "heap underflow"
max = A[1]
A[1] = A[A.heap-size]
A.heap-size = A.heap-size - 1
MAX-HEAPIFY(A, 1)//取出最大元素后将最后一个堆元素放在第一个位置来重新保持最大堆性质
reutrn max
程序中为何不将第二个元素升级为第一个元素?因为那样会打乱原子堆的性质,会增加算法的时间复杂度。
3)、HEAP-INCREASE-KEY过程:将元素 x 的关键字值增加到 k ,这里 k 值不能小于 x 的原关键字值。 时间复杂度为 O (lg n )。这个程序首先加入一个关键字为-∞的叶子节点来扩展最大堆,然后设置该节点的key,最后调用HEAP-EXTRACT-MAX 过程来保持最大堆的性质。
HEAP-INCREASE-KEY(A, i, key)
if key < A[i]
error "new key is smaller than current key"
A[i] = key
while i > 1 and A[PARENT(i)] < A[i]
exchange A[i] with A[PARENT(i)]
i = PARENT(i)
4)、MAX-HEAP-INSERT 过程:把元素 x 插入集合。时间复杂度为O (lg n )。
MAX-HEAP-INSERT(A, key)
A.heap-size = A.heap-size + 1
A[A.heap-size] = -∞
HEAP-INCREASE-KEY(A, A.heap-size, key)
该过程的运行时间也是 O (lg n )。