登录注册写文章

数据结构 - 二叉堆

流萤的分享

数据结构 - 二叉堆

Q：Top K问题：从海量数据n中找出前K个数据？

使用排序算法进行全排序，时间复杂度 $O(nlogn)$
使用数据结构二叉堆来解决，时间复杂度 $O(nlogk)$
1.使用小顶堆
2.将前 $k$ 个数放入堆中，然后从 $k+1$ 个数开始，如果大于堆顶元素，replace操作
3.扫描完毕后，堆中剩下的就是最大的前 $k$ 个数

1. 二叉堆（Heap）

(1) 定义

堆（Heap）：是一种树状的数据结构

堆中的元素必须具备 可比较性

任意节点的值总是 $\geq$ 或 $\leq$ 子节点的值
如果任意节点的值总是 $\geq$ 子节点 的值，称为：最大堆、大根堆、大顶堆
如果任意节点的值总是 $\leq$ 子节点 的值，称为：最小堆、小根堆、小顶堆

最大堆_二叉堆、最小堆_二叉堆

2. 二叉堆（Binary Heap）

(1) 定义

二叉堆（Binary Heap）：逻辑结构就是一棵完全二叉树，也叫完全二叉堆
二叉堆的底层一般用数组实现即可

二叉堆

索引 i 的规律（n是元素数量）

如果 $i = 0$ ，它是根节点

如果 $i > 0$ ，它的父节点的索引为 $floor((i - 1) / 2)$

如果 $2i + 1 \leq n - 1$ ，它的左子节点的索引为 $2i + 1$

如果 $2i + 1 > n - 1$ ，它没有左子节点

如果 $2i + 2 \geq n - 1$ ，它的右子节点的索引为 $2i + 2$

如果 $2i + 2 > n - 1$ ，它没有右子节点

(2) 最大堆 - 添加

上滤（Sift Up）：时间复杂度 $O(logn)$

循环执行以下操作
如果 node $>$ 父节点 - 与父节点交换位置
如果 node $<$ 父节点，或者node没有父节点 - 退出循环

上滤

(3) 最大堆 - 删除

下滤（Sift Down）：时间复杂度 $O(logn)$

用最后一个节点覆盖根节点

删除最后一个节点

循环执行以下操作
如果 node $<$ 最大子节点 - 与最大子节点交换位置
如果 node $\geq$ 最大子节点，或者node没有子节点 - 退出循环

下滤

(4) 最大堆 - 批量建堆（Heapify）

批量建堆2种方法：

自上而下的上滤

自下而上的下滤

1> 自上而下的上滤

自上而下的上滤本质是：添加

自上而下的上滤

2> 自下而上的下滤

自上而下的上滤本质是：删除

自下而上的下滤

3> 效率对比

所有节点的深度之和

仅仅是叶子节点，就有近 $n/2$ 个每个叶子节点的深度是 $O(logn)$ 级别

所有节点的高度之和

假设是满树，节点总个数为 $n$ ，树高为 $h$ ，那么 $n = 2^h - 1$

所有节点的树高之和 $H(n) = O(n)$

效率对比

最后编辑于：2021.07.08 17:49:00

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成，浏览时请结合常识与多方信息审慎甄别。
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

相关阅读更多精彩内容

数据结构-二叉堆
思考? ◼ 设计一种数据结构，用来存放整数，要求提供 3 个接口添加元素获取最大值删除最大值 ◼ 有没有更优...
鼬殿阅读 317评论 0赞 1
「数据结构」 | 二叉堆
点赞关注，不再迷路，你的支持对我意义重大！🔥 Hi，我是丑丑。本文「数据结构 & 算法」| 导读 —— 登高博见[...
彭旭锐阅读 1,594评论 0赞 5

【数据结构】二叉堆
【数据结构】二叉堆什么是数据结构？结构定义+结构操作结构定义是定义了这种数据结构具有的性质，结构操作的目的...
银TaMa阅读 367评论 0赞 1
【恋上数据结构与算法一】(十四)二叉堆
思考 ◼设计一种数据结构，用来存放整数，要求提供 3 个接口添加元素获取最大值删除最大值 ◼ 有没有更优的数据结构...
AlanGe阅读 494评论 0赞 0
数据结构-二叉堆
二叉堆的定义：二叉堆是一颗完全二叉树。完全二叉树：把元素顺序排列成树的形状。这里的顺序是自上而下，从左到右。 ...
habit_learning阅读 335评论 0赞 0

友情链接更多精彩内容

赞1赞

赞赏

手机看全文