mysql索引

什么是索引

MySql官方对索引的定义为：索引（index）是帮助mysql高效获取数据的数据结构。可以得到索引的本质：索引是数据结构。

可以理解为“排好序的快速查找数据结构”

一般来说索引本身也很大，不可能全部存储在内存中，因此索引往往以索引文件的形式存储在磁盘上。我们平常所说的索引，如果没有特别指明，都是指B树（多路搜索树，并不一定是二叉的）的结构组织的索引。

索引的优势

类似大学生图书馆建书目索引，提高数据检索的效率，降低数据库的IO成本
通过索引列对数据进行排序，降低数据排序的成本，降低了CPU的消耗

索引的劣势

实际上索引也是一张表，该表保存了主键与索引字段，并指向实体表的记录，所以索引列也是要占用空间的
虽然索引大大提高了查询速度，同时却会降低更新表的速度，如对表进行insert、update、delete。因为更新表时，mysql不仅要保存数据，还要保存一下索引文件每次更新添加了索引列的字段，都会调整因为更新所带来的键值变化后的索引信息
索引只是提高效率的一个因素，如果你的mysql有大数据量的表，就需要花时间研究建立最优秀的索引，或优化查询

索引的分类：

单值索引：即一个索引只包含单个列，一个表可以有多个单列索引
唯一索引：索引列的值必须唯一，但允许有空值，关键字：UNIQUE
复合索引（联合索引、组合索引）：即一个索引包含多个列

什么是联合索引（组合索引）

MYSQL 可以创建联合索引（即有多个列的索引）。一个索引最多可以包含 16 列。对于某些数据类型，你可以索引列的前缀。即在对字符串列创建索引时，我们可以使用 col_name(N) 语法，创建仅使用该列的前 N 个字符的索引。以这种方式创建的索引文件会小得多。对于 BLOB 或 TEXT 列建立索引时，必须为索引指定前缀长度。
MYSQL 的联合索引可以用于包含索引中所有列的查询语句的查询，或者是仅包含第一列，前两列，前三列，等等。如果你在索引定义中以正确的顺序指定列，那么联合索引就可以加快对同一张表的多种不同类型的查询。

什么是最左前缀法则

最左匹配原则就是指在联合索引中，如果你的 SQL 语句中用到了联合索引中的最左边的索引，那么这条 SQL 语句就可以利用这个联合索引去进行匹配

索引的创建条件和情况

1.哪些情况需要创建索引：

主键自动建立唯一索引
频繁作为查询条件的字段应该创建索引
查询中与其他表关联的字段，外键关系建立索引
频繁更新的字段不适合创建索引。
单键/组合索引的选择问题（在高并发下倾向创建组合索引）
查询中排序的字段，排序字段若通过索引去访问将大大提高排序速度。
查询中统计或者分组字段

2.哪些情况不要创建索引

where条件里用不到的字段不创建索引
表记录太少
经常增删改的表不要创建索引！原因：提高了查询速度，同时却会降低更新表的速度，如对表进行insert、update和delete。因为更新表时，mysql不仅要保存数据，还要保存一下索引文件
数据重复且分布平均的表字段，因此应该只为最经常查询和最经常排序的数据列建立索引。注意：如果某个数据列包含需要重复的内容，为它建立索引就没有太大的实际效果。

3.创建联合索引方法

ALTER TABLE `table_name` ADD INDEX  indexName (`col1`,`col2`,`col3`);

Mysql 性能分析

mysql query optimizer优化器：通过计算分析系统中收集到的统计信息，为客户端请求的query提供他认为最优的执行计划（他认为最优的数据检索方式，但不见得是dba认为是最优的，这部分最耗费时间）
mysql常见瓶颈
- cpu：cpu在饱和的时候一般发生在数据装入内存或从磁盘上读取数据的时候
- IO：磁盘I/O瓶颈发生在装入数据远大于内存容量的时候
- 服务器硬件的性能瓶颈：top,free,iostat和vmstat来查看系统的性能状态
Explain(重点)
使用EXPLAIN关键字可以模拟优化器执行SQL查询语句，从而知道MySql是如何处理SQL语句的。分析查询语句或是表结构的性能瓶颈

Explain分析讲解

id: select查询的序列号，包含一组数字，表示查询中执行的select子句或操作表的顺序,有三种情况：

情况	执行顺序
id相同	执行顺序由上到下
id不同	如果是子查询，id的序号会递增，id值越大，优先级越高，越先被执行
id相同不同都存在	id如果相同，可以认为时一组，从上往下顺序执行；在所有组中，id值越大，优先级越高，越先执行。衍生= DERIVED

select_type

类型	含义
simple	简单的select查询，查询中不包含子查询或者union
primary	查询中若包含任何复杂的子部分，最外层查询则被标记为primary
subquery	在select或where列表中包含了子查询
derived	在from列表中包含的子查询被标记为derived（衍生），mysql会递归执行这些子查询，把结果放在临时表里
union	若第二个select出现在union之后，则被标记为union；若union包含在from子句的子查询中，外层select会被标记为：derived
union result	从union表获取结果的select

table：这一行数据是关于哪张表的
type：访问类型
- 显示查询使用了何种类型：从最好到最差排序system>const>eq_ref>ref>range>index>ALL

类型	含义
sytem	表只有一行记录（等于系统表），这是const类型的特例，平时不会出现，这个也可以忽略不计
const	表示通过索引一次就找到了，const用于比较primary key或者unique索引。因为只匹配一行数据，所以很快，如将主键置于where列表中，mysql就能将该查询转换成一个常量
ef_ref	唯一性索引扫描，对于每个索引键，表中只有一条记录与之匹配，常见于主键或唯一索引扫描。
ref	非唯一性索引扫描，返回匹配某个单独值的所有行。本质上也是一种索引访问，他返回所有匹配某个单独值的行，然而，他可能会找到多个符合条件的行，所以他应该属于查找和扫描的混合体。
range	只检索给定范围的行，使用一个索引来选择行。key列显示使用了哪个索引，一般就是在你的where语句中出现了between、<、>、in等的查询。这种范围扫描索引扫描比全表扫描要好，因为它只需要开始于索引的某一点，而结束语另一点，不用扫描全部索引
index（full index scan）	index和all的区别为index类型之遍历索引树，这通常比all快，因为索引文件通常比数据文件小。（也就是说虽然all和index都是读全表，但index是从索引中读取的，而all是从硬盘中读的）
all(full table scan)	将遍历全表以找到匹配的行

备注：一般来说，得保证查询至少达到range级别，最好能达到ref

possible_keys:显示可能应用在这张表中的索引，一个或多个。查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询实际使用
key:实际使用的索引。如果为null，则没有使用索引。查询中若使用了覆盖索引，则该索引仅出现在key列表中
key_len：表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度。在不损失精确性的情况下，长度越短越好。ken_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得，不是通过表内检索出的。
ref：显示索引的哪一列被使用了，如果可以的话，尽量使用一个常量。哪些列或常量被用于查找索引列上的值
rows：根据表统计信息及索引选用情况，大致估算出找到所需的记录所需要读取的行数
Extra：包含不适合在其他列中希纳是但十分重要的额外信息
- using filesort：说明mysql会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。mysql中无法利用索引完成的排序操作成为“文件排序”。
- using temporary：使用了临时表保存中间结果，mysql在对查询结果排序时，使用了临时表，常见于order by 和分组查询group by。
- using index：表示相应的select操作中使用了覆盖索引，避免访问了表的数据行，效果不错。如果同时出现using where，表明索引被用来执行索引键值的查找；如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。
- NULL :表示查询的列未被索引覆盖，且where筛选条件是索引的前导列，这意味着用到了索引，但是部分字段未被索引覆盖，必须通过“回表”来实现，因而性能也比前两者差。
  覆盖索引的理解：就是select的数据列只用从索引中就能取得，不必读取数据行，mysql可以利用索引返回select列表中的字段，而不必根据索引再次读取数据文件，换句话说查询列要被所建的索引覆盖。
- using where：表明使用了where过滤
- using join buffer:使用了连接缓存
- impossible where: where子句的值总是false，不能用来获取任何元组
- select tables optimized away:在没有group by子句的情况下，基于索引优化min/max操作或者对于myisam存储引擎优化count(*)操作，不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化
- distinct: 优化distinct操作，在找到第一匹配的元组之后，即停止找相同值的动作。

索引创建原则

全值匹配我最爱
最佳左前缀法则
不在索引列上做任何操作（计算、函数、（自动或者手动）的类型转换），会导致索引失效而转向全表扫描
存储引擎不能使用索引中范围条件右边的列
尽量使用覆盖索引（只访问索引的查询（索引列和查询列一致）），减少select *
mysql在使用不等于（！= 或者 <>）的时候无法使用索引会导致全表扫描
is null ,is not null 也无法使用索引
like 以通配符开头 ('%abc...') mysql 索引失效会变成全表扫描的操作
字符串不加三引号索引失效
少用or，用它来连接时会索引失效

【优化总结口诀】

全值匹配我最爱，最左前缀要遵守；
带头大哥不能死，中间兄弟不能断；
索引列上少计算，范围之后全失效；
Like百分写最右，覆盖索引不写星；
不等空值还有or，索引失效要少用；
VAR引号不可丢，SQL高级也不难！

一般性建议

对于单值索引，尽量选择针对当前query过滤性更好的索引
在选择组合索引的时候，当前查询中过滤性最好的字段在索引字段顺序中，位置越靠前越好
在选择组合索引的时候，尽量选择可以能够包含当前查询中的where子句中更多字段的索引
尽可能通过分析统计信息和调整query的写法来达到选择合适索引的目的
尽量避免造成索引失效的情况
组合索引出现范围查询时，尽量把这个字段放在索引次序的最后面

Where语句	索引是否被使用
where a = 3	Y,使用到a
where a = 3 and b = 5	Y,使用到a，b
where a = 3 and b = 5 and c = 4	Y,使用到a,b,c
where b = 3 或者 where b = 3 and c = 4 或者 where c = 4	N
where a = 3 and c = 5	使用到a，但是c不可以，b中间断了
where a = 3 and b > 4 and c = 5	使用到a和b， c不能用在范围之后，b断了
where a is null and b is not null	is null 支持索引但是is not null 不支持,所以 a 可以使用索引,但是 b不一定能用上索引（8.0）
where a <> 3	不能使用索引
where abs(a) =3	不能使用索引
where a = 3 and b like 'kk%' and c = 4	Y,使用到a,b,c
where a = 3 and b like '%kk' and c = 4	Y,只用到a
where a = 3 and b like '%kk%' and c = 4	Y,只用到a
where a = 3 and b like 'k%kk%' and c = 4	Y,使用到a,b,c

问题

mysql使用innodb引擎，请简述mysql索引的最左前缀如何优化orderby语句。

问题的关键点

如果排序字段不在索引列上，filesort有两种算法： mysql就要启动双路排序和单路排序
无过滤不索引
order by非最左 filesort
顺序错 filesort
方向反 filesort

答案：

首先要对sql进行分析检查必要的查询字段，过滤字段，排序字段是否按顺序创建好了索引
如果查询字段不再索引中可能会产生回表操作会导致filesort，降低性能
一定要有过滤字段不然不能使用索引
排序字段和索引顺序不一致会导致filesort，降低性能
多个字段排序时如果方向不一致也会导致filesort，降低性能
使用explain观察查询类型和索引利用情况
尽可能减少不必要的filesort

参考：

3.尚硅谷MySQL数据库高级，mysql优化，数据库优化

mysql索引

mysql索引

什么是索引

索引的优势

索引的劣势

索引的分类：

什么是联合索引（组合索引）

什么是最左前缀法则

索引的创建条件和情况

1.哪些情况需要创建索引：

2.哪些情况不要创建索引

3.创建联合索引方法

Mysql 性能分析

Explain分析讲解

索引创建原则

问题

问题的关键点

答案：

相关阅读更多精彩内容

友情链接更多精彩内容