索引:排好序的快速查询数据结构
MySQL底层用的B+Tree,现在默认的引擎是InnoDB
为什么不用其它的数据结构存储数据呢?
不用二叉树:因为使用二叉树,当出现特殊情况,单边增长,会导致树跟表一样高,IO次数不会减少
不用红黑树:虽然红黑树会进行自平衡,使得树变矮,但是当数据非常庞大的时候,千万数据量的时候,红黑树也会变得非常高,IO次数依然很多
不用hash查找:当查询的条件为常量时,使用hash查找是很快(算出常量的hash码),但是如果查询条件为一个范围的话,就不好使了
不用BTree:每一个节点存储多个索引键值,这样就使得树横向增长,大大的降低了树的高度,极大的降低IO次数,基本不要超过10次IO,就能在千万级别的数据中查找到所需要的数据,但是缺点:每一个节点除了保存索引键值的数据外还保存了那一行的数据,由于每一次IO读取磁盘的数据大小是固定的,当一个节点里的每一条数据变大时,就会导致那一个节点所能存储的索引键值变少,为了在一次IO操作中读取足够的索引键值,就最终使用B+Tree,并且还能节省空间
使用B+Tree:每一个节点只存储索引键值,所有的数据存在树的叶子节点上,所有的叶子节点从最小到最大进行排序
注意:如果是主键索引,叶子节点才存储那整个行的数据,如果不是主键索引的B+Tree,叶子节点存储对应的主键id,所以MySQL推荐所有表的主键用整形并且自增,用整形好进行排序比较
建立索引:create index idx_字段名1_字段名2_字段名3 on 表名(字段名1,字段名2,字段名3)
查看索引:show index from 表名
删除索引:drop index 索引名 on 表名
引擎:InnoDB引擎(聚集索引)和MyISAM引擎(非聚集索引)
InnoDB引擎支持行锁,支持事务,B+Tree的叶子节点存储数据
MyISAM引擎只支持表锁,不支持事务,B+Tree的叶子节点存储文件指针,不存储数据,相比于InnoDB多一次IO操作
执行计划:MySQL是如何执行查询语句
EXPLAIN SELECT * FROM USER;
解释字段:
id:表的读取顺序
三种情况:
1、id相同,执行顺序由上至下
EXPLAIN SELECT * FROM USER,orders,route WHERE user.id = orders.userId AND orders.routeId = route.id;
结果:先查route路线表,再查orders订单表,最后查user用户表
2、如果是子查询,id的序号会递增,id值越大优先级越高,越先被执行
EXPLAIN SELECT * FROM USER WHERE user.id IN (SELECT userId FROM orders);
结果:先查orders订单表,再查user表
3、id相同又不同,id高的先执行,id相同的顺序执行
EXPLAIN SELECT * FROM USER WHERE user.id IN (SELECT userId FROM orders);
结果:<subquery2>中的2代表前面的id2,这个执行计划的意思查询orders表,再查询user表,最后查询<subquery2>虚表,这个虚表指的是执行sql之后得到的新表,在新表select *筛选最终结果
select_type:什么样的查询
取值:
SIMPLE:简单的select查询,查询中不包含子查询或者UNION
PRIMARY:查询中若包含任何复杂的子部分,最外层查询则被标记为PRIMARY,简而言之就是最后被加载的那个
SUBQUERY/MATERIALIZED:在SELECT或WHERE中包含子查询
DERIVED:在FROM列表中包含的子查询被标记为DERIVED(衍生表),MySQL会递归执行这些子查询,把结果放在临时表里
UNION:若第二个SELECT出现在UNION之后,则被标记为UNION;若UNION包含在FROM子句的子查询中,外层SELECT将被标记为:DERIVED
UNION RESULT:从UNION表获取结果的SELECT
table:查的哪个表
type:
显示查询使用了何种类型,
从最好到最差依次是:system>const>eq_ref>ref>range>index>ALL
取值:
system:表只有一行记录(等于系统表),这是const类型的特例,平时不会出现,这个可以忽略不记
const:表示通过索引一次就找到了,const用于比较primary key或者unique索引。因为只匹配一行数据,所以很快,如将主键置于where列表中,MySQL就能将该查询转换为一个常量
EXPLAIN SELECT * FROM USER WHERE id = 1;
eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配,常见于主键或唯一索引扫描
ref:非唯一性索引,返回匹配某个单独值的所有行
EXPLAIN SELECT * FROM orders WHERE userId = 1;
订单表里userId为1的用户下过多次订单
range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引
EXPLAIN SELECT * FROM USER WHERE id IN (1,2,3);
index:index和ALL区别为index类型只遍历索引树。这通常比ALL快,因为索引文件通常比数据文件小。index从索引中读数据,all从磁盘读数据
EXPLAIN SELECT username FROM USER;
ALL:全表扫描
EXPLAIN SELECT * FROM USER;
possible_keys:显示可能应用在这张表中的索引,一个或多个。查询涉及到的字段上若存在索引,则该索引将被列出,但不一定被查询实际使用
key:实际使用的索引。如果为NULL,则没有使用索引,查询中若使用了覆盖索引,则该索引出现在key列表中
key_len:表示索引中使用的字节数,可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下,长度越短越好
ref:显示索引的哪一列被使用了,如果可能的话,是一个常数。哪些列或常量被用于查找索引列上的值
EXPLAIN SELECT * FROM USER WHERE id = 1;
rows:根据表统计信息和索引选用情况,大致估算出找到所需的记录所需要读取的行数
extra:十分重要的额外信息
取值:
Using filesort:说明mysql会对数据库使用一个外部的索引排序,而不是按照表内的索引顺序进行读取,MySQL中无法利用索引完成的排序操作称为文件排序
Using temporary:使用了临时表保存中间结果,MySQL在对查询结果排序时使用临时表,常见于排序order by和分许查询group by。
Using index:表示相应的select操作中使用了覆盖索引(Covering Index),避免了访问了表的数据行,效率不错!如果同时出现Using where,表明索引被用来执行索引键值的查找;如果没有同时Using where,表明索引来读取数据而非执行查找动作。
Using where:
索引失效?(如何避免)
1、全值匹配我最爱
2、最佳左前缀法则(带头大哥不能死,中间兄弟不能断):如果索引了多列,要遵守最左前缀法则。指的是查询从索引的最左前列开始并且不跳过索引中间的列:比如:idx_a_b_c 查询条件中生效的索引有:a,ab,abc,ac带这些条件的可以使用,直接使用b或c索引失效,直接使用bc也不行,带头大哥a不能没有,此外a,ab,abc,ac的顺序可以变换,比如abc变成bac,cab,cba同样可以使用到索引,因为SQL查询优化器会选择最优的查询方式,将bac,cab,cba处理成abc。虽然ac用到了索引,但是中间兄弟不能断,这里没有用到b,所以实际只用到了a的索引,c的没有使用
3、不再索引列上做任何操作(计算、函数、(自动or手动)类型转换),会导致索引失效而转向全表扫描(索引列上无计算)
4、存储引擎不能使用索引中范围条件右边的列,但是范围的索引还是用到了的哦,type会变为range(范围之后全失效)
5、尽量使用覆盖索引(只访问索引的查询(索引列和查询列一致)),减少select *
6、mysql在使用不等于(!=或者<>)的时候无法使用索引会导致全表扫描
7、is null,is not null也无法使用索引
8、like以通配符开头('%abc...')mysql索引失效会变成全表扫描的操作(百分like加右边)
9、字符串不加单引号索引会失效(varchar类型一定不能少单引号,没有单引号会导致失效,会被项目经理骂死)
10、少用or,用它来连接时索引会失效