索引是数据库里最重要的概念之一,就像一本书的目录一样,
书本目录是静态的,而数据库一般是会不断更新,因此索引也是动态变化的。所以我们选择时就需要平衡读和写的效率。
常见的索引模型
哈希表:插入效率高;等值查询效率高,区间查询效率低。一般适用于K-V的nosql系统
有序数据:等值查询、区间查询效果率;插入效率低。适用于静态数据
树:插入和查询效率均十分出色。为了避免树过高,一般会使用N叉树。
innodb 的索引模型
innodb索引使用的是B+树。每一个索引都存在一个B+树中
聚集索引(主键索引):叶子节点存的是整行数据
非聚集索引:叶子节点存储的是主键的值
覆盖索引
- 使用由于非聚集索引查询时,需要先找到主键,然后再用主键去查询完整记录。但也有例外,如果索引中包含了所有要查询的字段,那么就不需要回表。这种称为覆盖索引。
核心的逻辑就是:
最左覆盖原则
- 联合索引的最左N个字段,或者字符串的最左M个字符
核心逻辑:对于联合索引(a,b),数据库是按照order (a,b)实现的,先排序a,在排序b.因此,如果已经有了(a,b),就不需要再针对(a) 建立索引了。 - 每一个索引都对应一个B+树存储空间,插入更新的时候都需要涉及到,因此建索引的时候也需要考虑空间
索引下推
- 索引下推优化(index condition pushdown), 可以在索引遍历过程中,对索引中包含的字段先做判断
核心逻辑:减少回表次数
问题1: 基于主键索引和索引的查询有什么区别?
- 主键索引查询,一次就能查到所有的值
- 普通索引查询,第一步拿到主键,然后再根据主键查询主键索引对应的B+数,即回表;不过也有例外,比如只查主键。
问题2: 如何选择主键?
- 空间:因为普通索引的叶子节点为主键,索引主键的大小会影响普通索引B+树的大小
- 自增主键:自增主键能够保证每次插入操作时都是追加操作,不容易发生叶子节点的分裂