什么是索引?
通俗的讲索引就类似书籍的目录,当我们需要从某本书中获取相关信息时,我们会先查看这本书的目录,通过目录快速定位到我们想要获取的信息的页码,而不需要翻看整本书来查找。这样就大大提高了我们获取信息的速度。 所以我们总结出索引的定义就是:“索引是存储引擎用于快速找到记录的一种数据结构”。
注意其中的一个关键字“存储引擎”,对于MySQL而言,索引是在存储引擎层实现的,而不是在服务器层。所以不同的存储引擎支持的索引类型不同,不同的存储引擎对同一种索引的实现也可能不同。所以下面在介绍的时候如果没有特别说明,我们基于的就是MySQL的InnoDB存储引擎。
索引的分类?
- B+Tree索引
- 哈希索引
- R-Tree
- 全文索引
索引的原理?
B-Tree索引
http://blog.csdn.net/ifollowrivers/article/details/73614549
https://zhuanlan.zhihu.com/p/23156203
查看索引情况
show index from test_b;
show index from test_c;
如何建立
索引对以下类型查询有效:
按值查找
全值匹配
匹配最左前缀
匹配列前缀
匹配范围值
精确匹配某一列并范围匹配另外一列
只访问索引的查询,即覆盖索引
顺序查找:查询中的order by操作。如果order by子句满足前面列出的几种查询类型,则这个索引也可以满足对应的排序需求。
索引的限制:
如果不是按照索引的最左列开始查找,则无法使用索引
不能跳过索引中的列
如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查找。 ? 试过了好像不是的。
这些限制其实都和索引的顺序相关,所以可能需要使用相同的列但顺序不同的索引来满足不同类型的查询需求。
索引的优点:
大大减少了服务器需要扫描的数据量
帮助服务器避免排序和临时表
可以将随机I/O变成顺序I/O
索引策略:
独立的列。指索引列不能是表达式的一部分,也不能是函数的参数
前缀索引。有时候需要索引很长的字符列,这会让索引变的大且慢,通常可以索引开始的部分字符,提高索引效率。但要注意索引选择性。缺点:无法使用前缀索引做order by和group by,也无法使用前缀索引做覆盖扫描。
多列索引。Mysql里面有个索引合并index merger的策略。
选择合适的索引列顺序
经验法则: 将选择性最高的列放在索引最前列
聚簇索引
是一种数据存储方式,InnoDB的聚簇索引在同一个结构中保存了B-Tree索引和数据行。叶子页包含了行的全部数据,但是节点页只包含了索引列。InnoDB通过主键聚集数据,没有主键会选择一个唯一的非空索引代替,没有这样的索引就隐式定义一个主键来作为聚簇索引。
- 覆盖索引
查询只需要扫描索引而无需回表。
- 使用索引扫描来做排序
索引好处:
1、缩小检索范围,加快检索速度;
2、在索引上排序及group by资源消耗极低。
大量使用索引也会给我们带来以下弊端:
1、增删改操作将比原来更加耗时;
2、索引的存储会占用存储空间。
设计索引的准则:
1. 索引并非越多越好,索引会影响insert,delete,update语句的性能
2. 避免堆经常更新的表进行过多的索引,并且索引中的列尽可能少
3. 数据量小的表最好不要使用索引
4. 在条件表达式中经常用到的不同值较多的列上建立索引,在不同值少的列上不要建立索引。
5. 当唯一时,指定唯一索引
6. 在频繁进行排序或分组的列上建立索引。如果待排序的列有多个,可以在这些列上建立组合索引。
1、较频繁的作为查询条件的字段应该创建索引;
2、唯一性太差的字段不适合单独创建索引,即使频繁作为查询条件;
3、更新非常频繁的字段不适合创建索引,因为添加索引后字段更新将更加耗时;
使用索引的注意项
1、对于创建的多列索引,只要查询条件使用了最左边的列,索引一般就会被使用。例如在a,b,c列上创建索引,那么查询条件"a=5","a=5 and b=6","a=7 and b=8 and c=6"都会使用该索引;
2、对于使用like的查询,查询如果是‘%aaa’不会使用到索引‘aaa%’会使用到索引;
3、如果条件中有or,那么除非or条件都带有索引,否则还是会全表扫描;
4、如果列类型是字符串,那一定要在条件中将数据使用引号引用起来,否则不使用索引;
5、如果字符串较长时,直接使用'create index KEY_NAME on table6 (name)' 命令创建的索引也将较长,浪费磁盘空间;这时候我们可以通过'create index KEY_NAME on table6 (name(4))' 命令限定索引长度;
6、连接查询时,在连接键上增加索引可以加快速度,同时遵循小表驱动大表原则;
7、如果mysql估计使用全表扫描要比使用索引快,则不使用索引。