没有索引时进行查找:
这时我们需要:
1、定位到记录所在的页
2、从页内查找相应的记录
一个简单的索引方案
在前面我们知道了为了主键快速一条记录在页中的位置而设立页目录,类似的办法,为了定位一条记录在所在的数据页我们也可以建立一个别的目录,在建立这个目录的过程中,我们必须做2件事情:
-
下一个数据页中用户记录的主键必须大于上一个页中用户记录的主键值
假设现在我们一个页面中只能存3条记录:因为页10最多只能放3条记录,所以我们再分配一个新页:
但这时,不满去我们提出来的约束:下一个数据页中用户记录的主键必须大于上一个页中用户记录的主键值
所以,此时我们需要把主键为5的记录移动页28中,再把主键为4的记录插入到页10中。
这个通过记录移动的操作来保证这个约束一直成立的过程,称之为页分裂。 -
给所有的页建立一个目录项
每个页对应一个目录项,每个目录项包括2部分:- 页的用户记录的最小值
-
页号(根据页号可以顶定位一个磁盘位置)
InnoDB 中的索引方案
上文叙述的目录项和用户记录长得挺像,只不过目录项中的两个列是主键和页号。所以,我们可以直接复用之前的数据页来存储目录项。采用record_type
字段区分普通的记录
- 0 表示普通记录
- 1 表示B+树非叶节点的目录项记录
- 2 表示 Infimum 记录
- 3 表示 Supremum 记录
同时,目录项的min_rec_flag
为1,普通记录都为0
上面的数据结构就是B+树,真正用来存放用户记录的都是B+树最底层的叶子节点,其余用来存放目录项记录的节点称为非叶子节点或者内节点,最上边的节点称为根节点。
这里我们假设一个数据页,只能存3条记录,实际上一个页可以存很多条记录。假设一个数据页可以存100条用户记录,1000条目录项记录,那么:
如果B+树只有1层,则最多存放 100 条用户记录
如果B+树只有2层,则最多能存放 1000 * 100 = 100000
如果B+树只有3层,则最多能存放 1000 * 1000 * 100 = 100000000
如果B+树只有4层,则最多能存放 1000 * 1000 * 1000 * 100 = 100000000000(一千亿)
所以,我们一般用到的B+树不会超过4层,也就意味着通过主键查找记录时,最多只需要进行4个页面的查找就可以找到。
页分裂
假设,目前我们有如下的记录:
需要再插入一条主键为4的记录,为了保证 "下一个用户数据页中的用户记录的主键值必须大于上一个页中用户记录的主键值" 这一状态依然成立,我们必须将主键为5的记录挪到下一个数据页,这个过程就叫作页分裂。
聚簇索引
上面关于主键的记录形成的一颗B+树的方式就是聚簇索引,InnoDB 会自动为主键创建聚簇索引。
二级索引
聚簇索引只有再搜索条件是主键的时候才能发挥作用,原因是B+树中的数据都是按照主键进行排序的。如果我们想以别的列作为搜索条件时该怎么办呢?
我们可以在建一颗B+树,这颗B+树采用不同的排序规则。
联合索引
同时,我们也可以多个列的大小作为排序规则,也就是同时为多个列建立索引。比如想让B+树按照c2 和 c3列的大小进行排序,这里面包括:
- 先把各个记录和页按照c2列进行排序
- 在记录c2列相同的情况下,再采用c3列进行排序
MySQL 中创建和删除索引的语句
InnoDB 会自动为主键或者带有UNIQUE
属性的列建立索引。
CREATE TABLE 表名 (
各个列的信息
(INDEX | KEY) 索引名 (需要被索引的单个列或多个列)
)
KEY
和 INDEX
是同义词,创建索引命名时以idx
为前缀,后面跟着需要建立索引的列名,且多个列名之间用下划线隔开。
也可以在修改表结构的时候添加索引
ALTER TABLE 表名 ADD (INDEX | KEY) 索引名 (需要被索引的单个列或多个列)
最后,删除这个索引。
ALTER TABLE index_demo DROP INDEX idx_c2_c3