Mysql面试题中索引肯定是重中之重。
刚工作那会第一次面试,就被问到了索引,我还记得当时的场景
问:知道Mysql的索引吗?
答:知道。
问:然后又问为什么要加索引?
答:我回答索引就像目录一样,能提升查找速度。
大家是不是感觉弱爆了,随着工作经验的增加,我对索引有了更深入的了解,下面就来分享下我眼中的索引,分享以问题的形式,从敲门到进门。
一、如果数据库中出现了慢查询怎么办?
Anw:加索引可以提升查找效率。
二、什么是索引?
Anw:索引是一种数据结构,Mysql的索引使用B+树实现,B+树可以快速搜索到想要的数据。
三、哪些数据结构可以做索引?
先来解释几个概念后续能用到:
节点的度:节点拥有子树的个数
树的度 :节点度的最大值
树的高度:树的层数
1.哈希表
哈希是一种算法,通过哈希算法可以算出索引下标这样就确定了数据所在的位置,实际上是一种数组结构,如果两个数据计算出的下标相同,则以链表的形式添加元素,这种数据结构的好处是它可以很快的定位到数据,但是不支持范围查询,JAVA语言中我们最常用的HashMap就是使用的这种结构,数组+链表+红黑树,至于为什么有红黑树,当链表过长时查询效率降低。转为红黑树提升查询效率。
2.平衡二叉树
一颗典型的树形结构,有根节点、左子树、右子树,左子树小于右子树,每个节点只有一个元素,支持范围查找,但是效率不如哈希表。
3.B树
和平衡二叉树差不多,但是树的度更大,也就是B树每个节点可以可以存储多个元素,索引和数据存在一起。
4.B+树
与B树的不同点在于,它的非叶子节点存放着索引,叶子节点存放数据,而且叶子节点通过链表链接在一起,它的优势在于,非叶子节点只存放索引它能够容纳更多的索引,树高比B树低,IO次数少,查询效率更高。
四、MysqlB+树中一个节点的大小有多大?
一个节点的大小为一页,一页是指Mysql中的一页,大小为16k,而操作系统中一页的大小为4k,那么也就是Mysql的一页=操作系统的四页。
五、Mysql的节点大小为一页16k,为什么是16k?
先来张图,看下主键索引和辅助索引
可以看到主键索引树上,存放着数据和索引,而辅助索引存放着索引和主键索引的位置,如果通过主键索引查询,直接在主键索引树就可以找到数据,如果通过辅助索引查找则还需要通过找到的主键索引值,回到主键索引树找到数据,称为回表。
非叶子节点:主键、指针
叶子节点:数据
叶子节点:一个节点的大小是一页16k,假设一条数据大小1k,则一个节点可以存放16条数据。
非叶子节点:一般来说主键id的类型是bigint(10)10b,Innodb引擎中指针为6b,那么一页可以存放 16000b/(10b+6b)=1000个索引,那么一颗高度为2的b+树可以存放1000*16=16000条数据,一颗高度为3的b+树可以存放1000*1000*16=16000000,哇哦 1600W条数据,是不是有惊人。查找数据的时候一次页的查找代表一次IO,那么通过主键查找一般只需要3次以内的IO就可以找到数据,这个大小是可以调整的,但一般不会调整。
六、什么是覆盖索引?
一般来说通过辅助索引查找数据时,先在辅助索引找到主键索引的位置,然后再去主键索引树查找数据,回表操作会耗费性能,如果查询的结果就是辅助索引,如select 辅助索引 from table,这样就可以避免回表,直接返回结果。
七、什么是联合索引?
假设建立了a、b、c为顺序的联合索引,相当于建立a,(a、b),(a、b、c)三个索引
查询bc肯定是用不到索引的,a、ab、ba、abc、acb都可以使用到索引的。
八、什么是索引下推?
还是那个假设,建立了a、b、c为顺序的联合索引
select * from table where a=10 and b like '%b' and d like '%d'
没有索引下推:先找到a=10的数据,返回mysql服务端,服务端根据条件遍历这些数据,是否有符合的数据。
索引下推:先返回符合a=10的索引,然后判断b like '%b' and d like '%d'符合条件的索引,符合条件,则找到数据,不符合直接拒绝。
有了索引下推,可以在like的时候减少回表次数。
九、重复值较多的字段不建议建立索引
重复值较多的话,如果通过这个字段进行查询,则需要频繁的回表,降低效率,效率还不如主键索引树查询。
十、Mysql order by索引
order by的字段,可以是联合索引,不能是函数。
感谢各位老铁阅读,更多请关注公众号:别明天就今天吧