【数据结构】线段树

【数据结构】线段树

老规矩,简书 Makedown 兼容性差。附上 CSDN 的 【数据结构】线段树

问题

最后一次用到线段树,是在深圳老东家实习面试的时候,Jason 问到我的一个问题(具体问题不记得了,大致意思):

  • 一个固定大小 n 的有限数组 x
  • action 1 : 可以随时更新某个区间 [i, j] 内的元素
  • action 2 : 可以查询某个区间 [i, j] 内的最大值或最小值

你应该如何做?

简单的解法 1 ?

普通数组形式存储,额外空间消耗 O\left(1\right),总共空间复杂度 O\left(n\right) .

action 1 : 遍历区间[i, j],进行元素的更新,时间复杂度 O\left(n\right) .

action 2: 遍历区间 [i, j],查找最大值或最小值,时间复杂度 O\left(n\right) .

显然这种形式对于有大量查询操作的情况下,耗时会很严重。

这时可以采用线段树进行处理。

线段树

时间复杂度和空间复杂度

需要预处理生成线段树。

预处理耗时:O\left(n\right)

总共空间复杂度:O\left(n\log n\right)

区间更新时间复杂度:O\left(\log n\right)

区间查询时间复杂度:O\left(\log n\right)

创建线段树

线段树采用二叉树形式存储:

  • 叶子节点对应原始数组 x 中的元素。
  • 非叶子节点表示它所有子孙叶子节点所在区间的最值。

假设数组 x 为:x = [ 2, 5, 1, 4, 9, 3 ] ,一共 n=6 个元素。

那么需要构建的线段树:

graph TD;
    A(区间 0-5 min: 1)-->B;
    A-->C;
    B(区间 0-2 min: 1)-->D;
    B-->E((1));
    C(区间 3-5 min: 3)-->F;
    C-->G((3));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((5));
    F(区间 3-4 min: 4)-->J((4));
    F-->K((9));

注意构建的时候,在非叶子节点更新你想要存储的区间信息(区间最大值,区间最小值等)。

区间查询

查询 [1, 4] 内的最小值

  1. 第一步:找到区间范围内的最下层节点:
graph TD;
    A(区间 0-5 min: 1)-->B;
    A-->C;
    B(区间 0-2 min: 1)-->D;
    B-->E((1 *));
    C(区间 3-5 min: 3)-->F;
    C-->G((3));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((5 *));
    F(区间 3-4 min: 4 *)-->J((4));
    F-->K((9));

图中标记 * 号的节点为当前需要查询的节点。

为什么查询的最下层是节点?而不是叶子节点?(请注意看 [3, 4] 区间,不需要查询其叶子节点)

按道理每个区间范围内的叶子节点都需要更新。

  • 线段树每个节点管理的都是一个区间(叶子节点管理的区间内只有一个元素)
  • 我们知道每个划分出来的区间的最小值
  • 如果区间查询的范围 [i, j] 完全包含其中一个区间 [ik, jk]i <= ik <= jk <= j
  • 显然这个区间 [ik, jk] 的最小值就是当前值
  • 无需再继续往下查询

[1, 4] 区间包含的节点是:1-1, 2-2, 3-4

  1. 第二步:递归向上查询最小值

对应的最小值分别为:x[1,1]=5, x[2,2]=1, x[3,4]=4

从上到下查找的过程(递归)示例,用 xij 表示区间 x[i, j] 的值:


min(x14) = min(x12, x34)
         = min(min(x11, x22), 4)
         = min(min(5, 1), 4)
         = min(1, 4)
         = 1

区间更新

更新 [1, 4] 之间所有元素加 3。

  1. 第一步:找到需要更新的最下层节点
graph TD;
    A(区间 0-5 min: 1)-->B;
    A-->C;
    B(区间 0-2 min: 1)-->D;
    B-->E((1 *));
    C(区间 3-5 min: 3)-->F;
    C-->G((3));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((5 *));
    F(区间 3-4 min: 4 *)-->J((4));
    F-->K((9));

图中标记 * 号的节点为当前需要更新的节点。

范围同上。

同理:

  • 我们知道每个区间的最小值
  • 如果区间更新的范围 [i, j] 完全包含其中一个区间 [ik, jk]i <= ik <= jk <= j
  • 显然这个区间 [ik, jk] 的最小值就是当前值 + 变更值
  • 无须继续向下更新
  1. 第二部:递归向上更新区间

递归往上更新后的结果为:

graph TD;
    A(区间 0-5 min: 2 *)-->B;
    A-->C;
    B(区间 0-2 min: 2 *)-->D;
    B-->E((4 *));
    C(区间 3-5 min: 3 *)-->F;
    C-->G((3));
    D(区间 0-1 min: 2 *)-->H((2));
    D-->I((8 *));
    F(区间 3-4 min: 7 #)-->J((4));
    F-->K((9));

图中标记 *# 号的节点为更新过程中需要更新最小值的节点。

等等,是不是有点不对劲?

还是 [3, 4] 这区间。[3, 4] 完全处于 [1, 4] 的更新范围内,在更新时无需更新其所有子节点。

但是按照上图的结果,如果我进行查询 [3, 3] 的最小值(或者更新值)。显然结果与图示的数据不符合。

所以需要增加更新标志位,处理上面所提及的情况。

graph TD;
    A(区间 0-5 min: 2)-->B;
    A-->C;
    B(区间 0-2 min: 2)-->D;
    B-->E((4));
    C(区间 3-5 min: 3)-->F;
    C-->G((3));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((8));
    F(区间 3-4 min: 7 # +3)-->J((4));
    F-->K((9));

该标志位记录当前区间的变更值。

在进行涉及该区间的子节点查询 / 更新时,需要取出该值递归更新沿途的区间。

查询 [3, 3]

graph TD;
    A(区间 0-5 min: 2)-->B;
    A-->C;
    B(区间 0-2 min: 2)-->D;
    B-->E((4));
    C(区间 3-5 min: 3)-->F;
    C-->G((3));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((8));
    F(区间 3-4 min: 7 # 0)-->J((7 *));
    F-->K((12 # +3));

其中 * 号为更新后的值,# 号为传递的标志位。

在更新了区间后,需要把原有的 [3, 4] 标志位清除(否则下次会导致重复更新)。

区间 [4, 5] 所有元素 -2

在查询 [3, 3] 进行这一步操作

graph TD;
    A(区间 0-5 min: 2)-->B;
    A-->C;
    B(区间 0-2 min: 2)-->D;
    B-->E((4));
    C(区间 3-5 min: 3)-->F;
    C-->G((3 *));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((8));
    F(区间 3-4 min: 7 # +3)-->J((4));
    F-->K((9 *));

其中 * 号的为需要更新的最底层节点。

graph TD;
    A(区间 0-5 min: 2)-->B;
    A-->C;
    B(区间 0-2 min: 2)-->D;
    B-->E((4));
    C(区间 3-5 min: 3)-->F;
    C-->G((3 -2 *));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((8));
    F(区间 3-4 min: 7 # 0)-->J((7 # +3));
    F-->K((9 +3-2 *));

把区间标志位和变更值一起传递(注意区间范围),同时清除已经更新完的区间标志位。

结果:

graph TD;
    A(区间 0-5 min: 1)-->B;
    A-->C;
    B(区间 0-2 min: 2)-->D;
    B-->E((4));
    C(区间 3-5 min: 1)-->F;
    C-->G((1));
    D(区间 0-1 min: 2)-->H((2));
    D-->I((8));
    F(区间 3-4 min: 7)-->J((7));
    F-->K((10));
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 215,294评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,780评论 3 391
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,001评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,593评论 1 289
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,687评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,679评论 1 294
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,667评论 3 415
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,426评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,872评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,180评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,346评论 1 345
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,019评论 5 340
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,658评论 3 323
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,268评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,495评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,275评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,207评论 2 352

推荐阅读更多精彩内容