索引的目的
创建索引的目的是为了提高查询的效率,就像书的目录一样。
索引的常见模型
哈希索引:哈希索引以K-V存储。可以在O(1)的时间复杂度找到元素。适合精确的等值查找,不适合范围查找。
有序数组:有序数组因为是有序的所以适合范围查找,但是如果数据会更改变化的话有序数组的维护成本高,所以一帮用于静态的数据表。
B+树:B+树由于其非叶子节点不保存数据,数据保存在叶子结点上,并且叶子节点相连的特点,适合用于范围查找,并且树的出队度非常大,树的高度低,所以访问磁盘的数量很少。
为什么用B+树做索引
- B+树的非叶子节点不保存数据,这样可以减少内存。
- B+树的高度一般不超过3,相对于红黑树,其磁盘I/O数量少,效率高。
- B+树的叶子节点保存数据,并且叶子节点相连,适合范围查找。
MyISAM和Innodb中B+树索引的不同
- MyISAM:数据和索引树分开存储,索引树的叶子节点保存的是数据的地址。主键索引和非主键索引都是一样的。
- Innodb:数据文件本身就是索引文件,主键索引中叶子结点保存了数据,非主键索引中的叶子结点保存的是主键索引的值,所以非主键索引查找数据需要经两次查询,一次非主键索引表的查询,查询出主键值之后再查询主键索引表,第二次操作称之为回表。
为什么要用自增的主键,唯一的主键可以吗?
首先说结论,自增主键将会使索引紧凑,每一次的新增操作都是顺序添加。而唯一的主键新增的值是随机的,会涉及到树的移动,并且树叶没有那么紧凑,导致分页,由于分页,在数据的查找中可能还会有更多的磁盘I/O操作去查找页。
简单的索引优化
- 在非主键索引中需要回表操作,覆盖索引可以避免会表。
覆盖索引:假如你所要查询的值都在索引树上,则可避免回表操作。
- 最左前缀匹配:对于联合索引,只能匹配到符合最左原则的索引。
- 索引下推:假如在最左前缀匹配下,不能匹配的就需要会表判断,但是假如where查询的未匹配的字段是联合索引中的字段,那么会在第一次查询的时候就先判断了是否成立,减少了回表的次数,这就是索引下推。
索引的建立和重建
为什么要索引前面说过了,那么为什么要重建索引呢?在innodb引擎中,随着数据的变更,索引文件会变的非常大,并且不那么紧凑,占用非常大的内存。所以重建索引是很有必要。那么怎么判断一个索引需要重建了呢?
对一个索引进行结构分析后,
‐‐如果该索引占用超过了一个数据块,且满足以下条件之一:B‐tree树的高度大于3;
‐‐使用百分比低于75%;数据删除率大于15%,就需要考虑对索引重建
另外,当我们删除主键索引的时候,会将其他索引也删除,所以可以用alert table engine =innodb来重建表。