聚集索引与非聚集索引
数据库索引在物理存储层面可以分为两类:聚集索引、非聚集索引。
1. 聚集索引(聚簇索引)
1.1 特性
聚集索引可以类比字典中的A-Z的排序,字和字母的顺序一致(物理顺序与列值逻辑顺序相同),数据行的物理顺序与列值(一般是主键的那一列)的逻辑顺序相同。
1.2 规则
因为聚集索引绑定了数据行的物理顺序,所以一个表中只能拥有一个聚集索引。
==注:推荐建表时设置聚集索引,如果后期才添加聚集索引,数据量很大的时候,效率会很低, 因为需要移动数据行来维持聚集索引的逻辑顺序。==
MySQL中聚集索引的规则如下:
- 如果一个主键被定义了,那么这个主键就是作为聚集索引
- 如果没有主键被定义,那么该表的第一个唯一非空索引被作为聚集索引
- 如果没有主键也没有合适的唯一索引,那么innodb内部会生成一个隐藏的主键作为聚集索引,这个隐藏的主键是一个6个字节的列,改列的值会随着数据的插入自增
2. 非聚集索引
2.1 特性
非聚集索引的逻辑顺序与磁盘上行的物理存储顺序不同,一个表中可以拥有多个非聚集索引,可以类比字典中的偏旁排序,字与偏旁顺序不一致。
除了聚集索引,其他的索引都是非聚集索引,非聚集索引包括:普通索引、唯一索引、全文索引等。
2.2 非聚集索引的二次查询问题
非聚集索引叶节点仍然是索引节点,只是有一个指针指向对应的数据块(上图中LeafLevel模块),此如果使用非聚集索引查询,而查询列中包含了其他该索引没有覆盖的列,那么他还要进行第二次的查询,查询节点上对应的数据行的数据。
==因为非聚集索引叶子节点除了会存储索引覆盖列数据,也存放聚集索引所覆盖的列数据。==
id | userName | score |
---|---|---|
1 | 张三 | 60 |
2 | 李四 | 70 |
3 | 王五 | 80 |
... | ... | ... |
其中id为聚集索引(主键),userName为非聚集索引
-- 这两种sql,可以直接拿到结果值,不需要二次查询
select id, username from t1 where username = '小明';
select username from t1 where username = '小明';
-- 下面的sql需要二次查询去获得 score 的数据
select username, score from t1 where username = '小明';
2.3 优化二次查询问题
非聚集索引会存放索引覆盖的列及聚集索引覆盖的列,若要查询这些之外的数据,就需要进行二次扫描,降低了查询效率。解决方案就是对于频繁查询的列创建联合索引。
参照上例:
给 username 和 score 两列创建联合索引index(username,score),再执行下面的sql就不需要进行二次扫描:
select username, score from t1 where username = '小明';
==注:复合索引需要满足最左侧索引原则,如果查询条件中没有最左边的一列或者多列,那么符合索引不起作用。==
条件:
- 最多可以把16个列合并成一个单独的复合索引
- 构成复合索引的列的总长度不能超过900字节,复合列的长度不能太长
- 所有的列必须来自同一个表中,不能跨表建立复合列
- 在复合索引中,列的排列顺序是非常重要的,应该首先定义最唯一的列