MySQL中有两种索引,分别是B-Tree索引和Hash索引
为什么要使用索引
因为在无索引的情况下,SQL语句会扫描一整张表来查询符合条件的数据,其时间开销与数据量成正相关。使用索引可以极大的提高查询的速度。但是索引也不是越多越好,因为每次查询时都会MySQL服务器都会选择合适的索引,要是索引过多的话会增加MySQL查询优化器选择的时间,加大时间开销。
B-Tree索引帮助我们在进行排序时避免使用磁盘空间(磁盘空间时内存的一个替代品,就好比虚拟内存,当内存不够时,系统会在硬盘上面开辟一个空间使用)
B-Tree索引可以把随机I/O变成顺序读取的I/O,更加充分的发挥磁盘的性能
索引的成本
增加写的操作
B-Tree索引
特点:
1.使用B+树的存储结构
2.能够加快查询的速度
3.顺序查找(更加适合范围查找)
使用场景:
1.快速查找全值匹配的查询(也就是where语句)。
2.匹配最左前缀查询。
当表中的索引有三个字段(c1,c2,c3)时,则(c1),(c1, c2), (c1, c2, c3) 会建立索引,但是(c2, c3)则不会建立索引。(因为不是索引最左前缀列)。
3.匹配列前缀,比如条件中有 num like ‘183%’时(就是匹配不以通配符开头的索引)。
4.当某一个字段建立了索引后,求该字段的min()或者max()时会使用到索引。
5.对索引的字段做group或者sort时会使用索引。
6.精确匹配某一列,并且范围匹配另一列。
7.可被用于sql中对列做比较的表达式,如=, >, >=, <, <=及between操作,也就是匹配范围值。
B-Tree索引的限制
1.如果不是按照索引的最左列开始查找的,则无法使用索引(注意,这里不是指的where条件的顺序,即where条件中,不管条件顺序,只要where中出现的列在多列索引中能够从最左开始连贯起来就能使用到多列索引)
2.不能跳过索引中的列,如:查询条件为姓和出生日期,跳过了名字列,这样,多列索引就只能使用到姓这一列
3.如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查询,如:where last_name=xxx and first_name like ‘xxx%’ and dob=’xxx’;这样,first_name列可以使用索引,这列之后的dob列无法使用索引。
Hash索引
特点:基于Hash表实现的索引,只有查询条件精确Hash索引中所有的列时,才能使用Hash索引。对于Hash索引的每一个列,存储引擎都会为每一行计算出一个Hash码。Hash存储中存放的就是Hash码。
限制:
不能用于查询结果的排序,
支持全键值匹配查询,不支持部分键值的匹配查询,同时也不支持范围查询
不适合用于有很多重复值得列上(比如性别),因为会有Hash冲突,降低效率
一条SQL语句执行的过程
客户端发送SQL到MySQL服务器
服务器检查是否可以在查询缓存中命中该SQL(特别困难),是使用Hash来进行全值得匹配,即使有一个字节不匹配也不行。还有就是读取时还会对缓存加锁(在一个读写频繁的系统,最好不要使用查询缓存)
服务器对SQL进行解析,预处理,在又优化器生成对应的执行计划
根据执行计划,调用存储引擎的API查询数据
返回给客户端结果