优先队列的应用

优先队列常用于解决两种问题:

选择问题

选择问题需要解决的问题大致可以描述为:从输入的 N 个元素中,找到第 k 个最大的元素。

算法一:第一个能够想到的解决办法是简单排序算法,这个算法的运行时间为 O(N^2).

算法二:这个算法是在简单排序的算法上做了改进:首先将 k 个元素读入一个数组并将其排序,此时,第 k 个位置上的元素就是最小的元素,一个一个地处理其余的元素,使其与数组中的第 k 个元素比较,如果该元素大,那么将第 k 个元素除去,而这个新元素则被放在数组中其余 k-1 个元素间正确的位置上。当算法结束时,第 k 个位置上的元素就是问题的解。该算法的运行时间为 O(N*k)

算法三:为了简单起见,假设我们只考虑找出第 k 个最小的元素。该算法很简单。我们将 N 个元素读入一个数组。然后对该数组应用 BuildHeap 算法。最后,执行 k 次 DeleteMin 操作。从该堆最后提取的元素就是我们的答案。显然,通过改变堆序性质,我们就可以求解原始的问题 —— 找出第 k 个最大的元素。这个算法的正确性应该是显然的。如果使用 BuildHeap,构造堆的最坏情形用时是 O(N),而每次 DeleteMin 用时 O(log N)。由于有 k 次 DeleteMin,因此我们得到总的运行时间为 O(N+klog\space N)。如果 k = O(\frac{N}{log N}),那么运行时间取决于 BuildHeap 操作,即 O(N)。对于大的 k 值,运行时间为 O(k \log N)。如果 k = \frac{N}{2},那么运行时间为 O(N\log N)。注意⚠️,如果我们对 k= N 运行该程序并在元素离开堆时记录它们的值,那么我们实际上已经对输入文件以时间 O(N \log N)做了排序,这种快速的排序算法叫作堆排序(heapsort)。

算法四:我们回到原始问题,找出第 k 个最大的元素。这个算法的思路和算法二类似。在任意时刻我们都将维持 k 个最大元素的集合 S。在前 k 个元素读入之后,当再读入一个新的元素时,该元素将与第 k 个元素进行比较,记这第 k 个最大的元素为 S_k。注意,S_k 是 S 中最小的元素。如果新的元素更大,那么用新的元素代替 S 中的 S_k。此时,S 将有一个新的最小元素,它可能是新添加的元素,也可能不是。在输入终了时,我们找到 S 中最小的元素,将其返回,它就是答案。与算法二不同的是,这里我们使用一个堆来实现 S。前 k 个元素通过调用一次 BuildHeap 以总时间 O(k)被置入堆中。处理每个其余的元素的时间为 O(1)(检验元素是否进入 S)再加上时间 O(\log k)(在必要时删除 S_k并插入新元素)。因此,总的时间是 O(k+(N-k)\log k) = O(N \log k)。该算法也给出找出中位数的时间界 O(N \log N)

事件模拟

对于某些概率分布以及 k 的一些值,答案都可以精确地计算出来。然而随着 k 变大,分析明显变得困难,因此使用计算机模拟事件的运作很有吸引力。比如,可以用这种方法,银行官员可以确定为保证合理,通畅的服务需要多少出纳员。

模拟由处理中的事件组成。我们以银行系统为例,这里的两个事件是:一位顾客的到达,以及一位顾客的离去从而腾出一名出纳员。

我们可以使用概率函数来生成一个输入流,它由每位顾客的到达时间和服务时间的序偶组成,并通过到达时间排序。我们不必使用一天中的准确时间,而是使用单位时间量,称之为一个滴答(tick)。

进行这种模拟的一个方法是启动在 0 滴答处的一台模拟钟表。我们让钟表一次走一个滴答,同时查看是否有一个事件发生。如果有,那么我们处理这个(些)事件,搜索统计资料。当没有顾客留在输入流中且所有的出纳员都闲着的时候,模拟结束。

这种模拟策略的问题是,它的运行时间不依赖顾客数或事件数(每位顾客有两个事件),但是却依赖滴答数,而后者实际又不是输入的一部分。为了看清为什么问题在于此,假设将钟表的单位改成滴答的千分之一(millitick)并将输入中的所有时间乘以 1000,则结果将是模拟用时长了 1000 倍!

避免这种问题的关键是在每一个阶段让钟表直接走到下一个事件的事件。从概念上看这是容易做到的。在任意时刻,可能出现的下一个事件或者是输入文件中下一个顾客的到达,或者是在一名出纳员处一位顾客离开。由于可以得知将发生事件的所有时间,因此我们只需找出最近的要发生的事件并处理这个事件。

如果事件是离开,那么处理过程包括搜集离开的顾客的统计资料以及检验队伍(队列)看是否还有另外的顾客在等待。如果有,那么我们加上这位顾客,处理所需要的统计资料,计算该顾客将要离开的时间,并将离开事件加到等待发生的事件集中。

如果事件是到达,那么我们检查闲着的出纳员。如果没有,那么我们把该到达事件放到(队伍)队列中;否则,我们分配顾客一个出纳员,计算顾客的离开时间,并将离开事件加到等待发生的事件集中。

在等待的顾客队伍可以实现为一个队列。由于我们需要找到最近的将要发生的事件,合适的办法是将等待发生的离开的集合编入一个优先队列中。下一个事件是下一个到达或下一个离开(那个发生早就是哪个),它们都容易达到。

为模拟编写例程很简单,但是可能很耗费时间。如果有 C 个顾客(因此有 2C 个事件)和 k 个出纳员,那么模拟的运行时间将会是 O(C \log(k+1)),因为计算和处理每个事件花费 O(\log H),其中 H= k+1 为堆的大小。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,558评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,002评论 3 387
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 159,036评论 0 349
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,024评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,144评论 6 385
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,255评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,295评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,068评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,478评论 1 305
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,789评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,965评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,649评论 4 336
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,267评论 3 318
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,982评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,223评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,800评论 2 365
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,847评论 2 351

推荐阅读更多精彩内容