B-树

一个m阶的B-树具有如下几个特征:

  1. 根节点至少有两个子女
  2. 每个中间节点都包含k-1个元素和k个孩子,其中m/2<=k<=m
  3. 每个叶子节点都包含k-1个元素,其中m/2<=k<=m
  4. 所有的叶子结点都位于同一层
  5. 每个节点中的元素从小到大排序,节点当中k-1个元素正好是K个汉子包含的元素的值域划分。

例:3阶的B-树


3.png

B-树查询的过程,假如我们要查询的数值是5
第一次磁盘IO:


4.png

在内存中定位(和9比较):


5.png

第二次磁盘IO
6.png

在内存中定位(和2、6比较):
7.png

第3次磁盘IO:


8.png

在内存中定位(和3、5比较)
9.png

通过整个流程我们可以看出,B-树在查询中的比较次数其实不比二叉查找树少,尤其当单一节点中的元素数量很多时。可是相比磁盘IO的速度,内存中比较耗时几乎可以忽略。所以只要树的高度足够低,IO次数足够少,就可以提升查找性能。相比之下节点内部元素多一些也没有关系,仅仅是多了几次内存交互,只要不超过磁盘页的大小即可。这就是B-树的优势之一。
插入节点

B-树插入新节点的过程比较复杂,而且分成很多种情况。例如插入值4
自顶向下查找4的节点位置,发现4应当插入到节点元素3,5之间


10.png

节点3,5已经是两元素节点,无法再增加。父亲节点2,6也是两元素节点,也无法再增加。根节点9是单元素节点,可以升级为两元素节点。于是拆分节点3,5与节点2,6,让根节点9升级为两元素节点4,9。节点6独立为根节点的第二个孩子。


1.png

B-树能够始终维持多路平衡,这也是B-树的一大优势:自平衡。
删除节点

比如删除元素11

自顶向下查找元素11的节点位置。
2.png

删除11后,节点12只有一个孩子,不符合B树规范。因此找出11,12,15三个节点的中位数13,取代节点12,而节点12自身下移成为第一个孩子(这个过程称为左旋)
3.png

4.png

B-树主要应用于文件系统以及部分数据库索引,比如著名的非关系型数据库MongoDB.
而大部分关系型数据库,比如Mysql,则使用B+树作为索引。

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • B树的定义 一棵m阶的B树满足下列条件: 树中每个结点至多有m个孩子。 除根结点和叶子结点外,其它每个结点至少有m...
    文档随手记阅读 14,585评论 0 25
  • 原文链接 B树 1.前言: 动态查找树主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(...
    非典型程序员阅读 4,897评论 0 3
  • B树 1.前言: 动态查找树主要有:二叉查找树(Binary Search Tree),平衡二叉查找树(Balan...
    铁甲依然在_978f阅读 5,291评论 0 4
  • B-树,就是B树,B树的原英文名是B-tree,所以很多翻译为B-树,就会很多人误以为B-树是一种树、B树是另外一...
    xx1994阅读 23,949评论 1 17
  • 1 概述 前一讲提到了二叉搜索树,从直觉的角度看,貌似较好地解决了快速搜索的问题,其实不然。如果给定一个关键字序列...
    CodingTech阅读 10,693评论 0 11