1. B树
B树也称B-树,它是一颗多路平衡查找树。我们描述一颗B树时需要指定它的阶数,阶数表示了一个结点最多有多少个孩子结点,一般用字母m表示阶数。当m取2时,就是我们常见的二叉搜索树。
一颗m阶的B树定义如下:
- 每个结点最多有m-1个关键字。
- 根结点最少可以只有1个关键字。
- 非根结点至少有Math.ceil(m/2)-1个关键字。
- 每个结点中的关键字都按照从小到大的顺序排列,每个关键字的左子树中的所有关键字都小于它,而右子树中的所有关键字都大于它。
-
所有叶子结点都位于同一层,或者说根结点到每个叶子结点的长度都相同。
1. B+树简介
B+树针对磁盘寻址慢的特点对二叉树做优化,将原本高瘦的树做矮胖处理,减少磁盘寻址次数,避免数据库在索引查询过程中查询次数过多而花费大量时间。B+树自顶向下查询,自底向上插入。
m阶B+树具有如下特点:
- 根节点至少有两个子女;
- 每个中间节点至少包含 ceil / (m/2) 个孩子,最多有m个孩子;
- 每一个叶子节点都包含k-1个元素,其中m/2 <= k <= m;
- 所有叶子节点都位于同一层;
- 每个叶子节点的元素从小到大排序,节点中k-1个元素正好是k个孩子包含的元素的值域划分;
- 每一个父节点都出现在子节点中,是子节点最大或最小的元素;
- 每一个叶子节点都有一个指针,指向下一个数据,形成有序链表;
2. B+树与B树区别
- 有k个子结点的结点必然有k个关键码;
- 非叶结点仅具有索引作用,跟记录有关的信息均存放在叶结点中。
- 树的所有叶结点构成一个有序链表,可以按照关键码排序的次序遍历全部记录。
B+树中间节点没有Data数据,所以同样大小的磁盘页可以容纳更多的节点元素。所以数据量相同的情况下,B+树比B树更加“矮胖“,因此使用的IO查询次数更少。B树的查找并不稳定(最好的情况是查询根节点,最坏查询叶子节点)。而B树每一次查找都是稳定的。