1)什么是索引:
索引是帮助mysql高效获取数据的数据结构,
索引的本质就是数据结构。
结论:数据本身之外,数据库还维护着一个满足特定查找算法的数据结构,这些数据结构以某种方式指向数据,这样就可以在这些数据结构的基础上实现高级查找算法,这种数据结构就是索引。
一般来说,索引本身也很大,不可能全部储存在内存中,因此,索引往往以索引文件的形式储存在磁盘上。
2)索引的优势和劣势:
优势:
提高数据检索的效率,降低了数据库OI成本。
通过索引列对数据进行排序,降低数据排序成本,降低了CPU的消耗。
劣势:
实际上索引也是一张表,该表保存了主键与索引字段,并指向实体表的记录所以索引列也是要占内存空间的。
虽然索引大大的提高了查询的速度,同时也会降低更新表的速度,对表进行insert、update、delete。因为更新表时,mysql不仅要保 存数据,还要保存一下索引文件每次更新添加了索引列的字段,都会调整因为更新带来的键值变化后的索引信息。
索引只是提高效率的一个因素,如果你的mysql有大数据量的表,就需要花时间研究建立最优秀的索引,或优化查询。
3)索引的类型:
单值索引:即一个索引只包含单个列,一个表可以有多个单列索引。
唯一索引:索引列的值必须唯一,但允许空值。
复合索引:即一个索引包含了多个列。
- 基本语法:
ALTER TABLE tb1_name ADD PRIMARY KEY(column_list);//该语句添加一个主键索引,这意味着索引值必须是唯一的,且不能为null。
ALTER TABLE tb1_name ADD UNIQUE 'index_name' (column_list);//该语句添加的是唯一索引,该索引的值必须是唯一的(除了NULL外,NULL可能会出现很多次)
ALTER TABLE tb1_name ADD INDEX 'index_name' (column_list);//该语句添加普通索引,索引值可出现多次
ALTER TABLE tb1_name ADD INDEX 'idx_column_list1_column_list2' (`column_list1`, `column_list2`);//该语句添加复合索引
5)mysql索引结构:
常见的MySQL索引有 :BTree索引:Hash索引:full-text全文索引:R-Tree索引:
主要的是:BTree索引
6)那些情况下需要建立索引:
1、主键自动建立唯一索引。
2、频繁作为查询条件的字段应该创建索引。
3、查询中与其他表关联的字段,外键关系建立索引。
4、频繁更新的字段不适合创建索引(因为每次更新不单单更新了记录还会更新索引文件)。
5、where条件里用不到的字段不用创建索引。
6、单键/组合索引选择的问题?(在高并发下偏向创建组合索引)。
7、查询中排序的字段,排序字段若通过索引去访问将大大提高排序速度。
8、查询中统计或分组字段。
7)那些情况下不需要建立索引:
1、表记录太少。
2、经常增删改的表。
原因:索引虽然提高了查询的速度,同事缺会降低更新表的速度,如对表进行INSERT、UPDATE、DELETE、MySQL不仅要保存、修改、删除数据,还要保存、更新、删除索引文件。
3、对数据重复且分布平均的表字段不应该建立索引,应该只为最经常查询和最近常排序的数据列建立索引。
8)覆盖索引:
理解方式一(推荐):
就是select的数据列只用从索引中就能获取的,不必读取数据行,MySql可以利用索引返回select列表中的字段,而不必更具索引在此读取数据文件。换句话说,查询列要被所建的索引覆盖。
理解方式二:
索引是高效找到行的一个方法,但是数据库一般也能使用索引找到一个列的数据,因此他不必读取整个行,毕竟索引叶子节点储存了他们索引的数据,当能通过读取索引就能获取想要的数 据,那就不需要在读取行了,一个索引包含了(或覆盖了)满足查询结果的数据,就叫覆盖索引。
注意:
如果要数用覆盖索引,一定要注意select列表中只取出需要的列,不可select *。
因为如果要将所用字段一起做索引,会导致索引文件过大,查询的性能下降。