6. 数据结构 - B 树

这篇文章收录在我的 Github 上 algorithms-tutorial,另外记录了些算法题解,感兴趣的可以看看,转载请注明出处。

我们面临一个实际的问题:就是在大规模的数据存储中,实现数据索引查询的背景下,这样会导致二叉查找树结构由于树的深度过大而导致磁盘 I/O 读写过于频繁,进而导致查询效率低下。

那么我们需要一种机制减少树的深度:这也就是 B 树的思想,采用多叉树结构

(一) 基本概念:

m阶(m 必须是奇数) B-树是一个 m 路树 (即每个节点最多可以含有 m 个子节点)

一棵 B-树是一棵平衡的 m 路搜索树,它或者是空树,或者它一般具有以下性质:

  1. 根结点的儿子数为[2, M]
  2. 除根结点以外的非叶子节点的儿子数为[M/2, M]
  3. 每个结点存放至少M/2-1(取上整)和至多M-1个关键字
  4. 每个节点的关键字比它的子节点个数少 1 (叶结点除外)
  5. 所有的叶子都在同一个层级

B-树具有良好的平衡性(因为其所有的叶子都在同一个层级)

优点:保证只有少数的磁盘访问,解决数据结构不在主存中的数据存储问题。
B 树 可以为系统最优化地对大块数据进行读和写的操作,普遍运用在数据库和文件系统。

(二) 基本操作:

1、查找元素:

B-树的搜索,从根结点开始,对结点内的关键字(有序)序列进行二分查找,如果命中则结束,否则进入查询关键字所属范围的儿子结点;重复,直到所对应的儿子指针为空,或已经是叶子结点;

例如:1.在一棵 5 阶B-树中查找元素 29

4.gif

首先29比根节点值大,所以找根节点的右子数,然后再根据值得判断,发现 29 介于 28 和 48 之间,然后在从中间子树继续查找下去。

2.同样在该树查找一个不存在元素 54

5.gif

2、插入元素:

在插入一个元素到一棵 B-树中的叶子节点时(可能该树只有一个根结点),结果导致该叶子包含的元素个数加 1。

这时候就需要讨论:

第一步:如果该节点的元素个数还没达到 m,则插入完后无需处理

比如:在 B-树中插入元素 3

14.gif

第二步:如果该节点元素个数达到 m 时,这时候将元素插入到合适的位置,将最中间的元素取出,成为该节点的父节点元素,然后将其余左右元素拆成两个新节点

比如:在 B-树中插入元素 44

13.gif

第三步刚才的操作可能导致父节点的元素个数达到 m,这时候用情况 2 迭代处理,直到如果遇到根结点元素个数达到 m,则最中间元素将成为新的根结点。

比如:在 B-树中插入元素 45

6.gif

3、删除元素:

我们需要分两种情况进行讨论:

一、如果该元素存在于叶子结点,直接删除它,无需进行其它处理。

7.gif

二、如果该元素存在于非叶子节点,那么删除它将会留下一个空位,这时候我们需要一些处理来填充该位置

因为节点的元素个数在 [M/2, M] 的范围内,所以比如这里我们以 5 阶B-树为例,判断节点元素是否充足即满足个数则至少拥有三(2 + 1)个元素的节点才算是有充足的元素。

1.如果被删元素的左子树拥有足够的元素,这时候我们只需拿左子节点的最大值元素上来填充即可

例如:在 B-树中删除元素 23

8.gif

2.当左子树不够元素而右子树元素充足时,这时候我们拿右子树的最小值元素上来进行填充

例如:在 B-树中删除元素 35

10.gif

3.当左右子树所含元素均不足时,但左子树的左边兄弟节点的元素个数充足,这时我们需要拿左边的兄弟节点来进行调整。

例如:在 B-树中删除元素 16

![Upload 12.gif failed. Please try again.]

4.当左右子树所含元素均不足时,但左子树的左边兄弟节点的元素个数也不足时,这时候我们还是拿左子树的最大值元素进行填充,之后再将该节点与其他节点合并形成新的节点。

例如:在 B-树中删除元素 40

11.gif

最大容纳量计算:

假设这是有棵 m 阶 B-树,则每层所能容纳最多元素个数为:

根节点: m - 1
level1: m(m - 1)
level2: m^2(m - 1)
...
leveln: m^n(m - 1)

因此一棵树高为 h 的 B-树最多能容纳的元素为 m^(h + 1) - 1 即(将上面式子相加)

例如:一课 5 阶 B-树的高度为 2,则该树所能容纳最多元素个数为 5^3 - 1 = 124

(三) 2-3 树:

当 m = 3 时,此时的 B-树又称为 2-3 树,因为之前实验课要求 Java 实现 2-3 树,实现细节就不细说,我放在 Github 上面,感兴趣的可以去看一看。

参考资料:

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 194,390评论 5 459
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 81,821评论 2 371
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 141,632评论 0 319
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 52,170评论 1 263
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 61,033评论 4 355
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 46,098评论 1 272
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 36,511评论 3 381
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 35,204评论 0 253
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 39,479评论 1 290
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 34,572评论 2 309
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 36,341评论 1 326
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 32,213评论 3 312
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 37,576评论 3 298
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 28,893评论 0 17
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 30,171评论 1 250
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 41,486评论 2 341
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 40,676评论 2 335

推荐阅读更多精彩内容

  • B树的定义 一棵m阶的B树满足下列条件: 树中每个结点至多有m个孩子。 除根结点和叶子结点外,其它每个结点至少有m...
    文档随手记阅读 13,097评论 0 25
  • 原文链接 B树 1.前言: 动态查找树主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(...
    非典型程序员阅读 1,133评论 0 3
  • B树 1.前言: 动态查找树主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(Balan...
    铁甲依然在_978f阅读 1,442评论 0 4
  • B-树,就是B树,B树的原英文名是B-tree,所以很多翻译为B-树,就会很多人误以为B-树是一种树、B树是另外一...
    xx1994阅读 23,461评论 1 17
  • A趴在桌子上睡着了。 门“砰”地一下被带上,迎面走过来三个彪形大汉。其中一个,金链子;另一个,穿着施虐一般的衣服,...
    我认识简书的CEO阅读 384评论 0 0