数据结构 - 二叉堆

Q:Top K问题:从海量数据n中找出前K个数据?

  • 使用 排序算法 进行全排序,时间复杂度O(nlogn)
  • 使用 数据结构 二叉堆 来解决,时间复杂度O(nlogk)
    1.使用小顶堆
    2.将前k个数放入堆中,然后从k+1个数开始,如果大于堆顶元素,replace操作
    3.扫描完毕后,堆中剩下的就是最大的前k个数

1. 二叉堆(Heap)

(1) 定义

堆(Heap):是一种树状的数据结构

  • 堆中的元素必须具备 可比较性
  • 任意节点的值总是 \geq\leq 子节点的值
    如果任意节点的值总是 \geq子节点 的值,称为:最大堆、大根堆、大顶堆
    如果任意节点的值总是 \leq子节点 的值,称为:最小堆、小根堆、小顶堆
最大堆_二叉堆、最小堆_二叉堆

2. 二叉堆(Binary Heap)

(1) 定义

二叉堆(Binary Heap):逻辑结构就是一棵完全二叉树,也叫完全二叉堆
二叉堆的底层一般用数组实现即可

二叉堆

索引 i 的规律(n是元素数量)

  • 如果i = 0,它是根节点
  • 如果i > 0,它的父节点的索引为 floor((i - 1) / 2)
  • 如果2i + 1 \leq n - 1,它的左子节点的索引为2i + 1
  • 如果2i + 1 > n - 1,它没有左子节点
  • 如果2i + 2 \geq n - 1,它的右子节点的索引为2i + 2
  • 如果2i + 2 > n - 1,它没有右子节点

(2) 最大堆 - 添加

上滤(Sift Up):时间复杂度O(logn)

  • 循环执行以下操作
    如果 node > 父节点 - 与父节点交换位置
    如果 node < 父节点,或者node没有父节点 - 退出循环
上滤

(3) 最大堆 - 删除

下滤(Sift Down):时间复杂度O(logn)

  • 用最后一个节点 覆盖 根节点
  • 删除 最后一个节点
  • 循环执行以下操作
    如果 node < 最大子节点 - 与最大子节点交换位置
    如果 node \geq 最大子节点,或者node没有子节点 - 退出循环
下滤

(4) 最大堆 - 批量建堆(Heapify)

批量建堆2种方法:

  • 自上而下的上滤
  • 自下而上的下滤
1> 自上而下的上滤

自上而下的上滤 本质是:添加

自上而下的上滤
2> 自下而上的下滤

自上而下的上滤 本质是:删除

自下而上的下滤
3> 效率对比

所有节点的深度之和

  • 仅仅是叶子节点,就有近 n/2 个每个叶子节点的深度是 O(logn)级别

所有节点的高度之和

  • 假设是满树,节点总个数为n,树高为h,那么 n = 2^h - 1
  • 所有节点的树高之和 H(n) = O(n)
效率对比
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 思考? ◼ 设计一种数据结构,用来存放整数,要求提供 3 个接口 添加元素 获取最大值 删除最大值 ◼ 有没有更优...
    鼬殿阅读 280评论 0 1
  • 点赞关注,不再迷路,你的支持对我意义重大!🔥 Hi,我是丑丑。本文「数据结构 & 算法」| 导读 —— 登高博见[...
    彭旭锐阅读 1,456评论 0 5
  • 【数据结构】 二叉堆 什么是数据结构? 结构定义+结构操作 结构定义是定义了这种数据结构具有的性质,结构操作的目的...
    银TaMa阅读 329评论 0 1
  • 思考 ◼设计一种数据结构,用来存放整数,要求提供 3 个接口添加元素获取最大值删除最大值 ◼ 有没有更优的数据结构...
    AlanGe阅读 422评论 0 0
  • 二叉堆的定义: 二叉堆是一颗完全二叉树。 完全二叉树:把元素顺序排列成树的形状。这里的顺序是自上而下,从左到右。 ...
    habit_learning阅读 291评论 0 0