索引概念
索引(在MySQL中也叫做“键(key)”)是存储引擎用于快速找到记录的一种数据结构,这也是索引最基本的功能。
例如
select name from user where user_id = 5
如果user_id列上建有索引,则MySQL将使用该索引找到user_id 为 5的行,即MySQL现在索引上按值进行查找,然后返回包含该值的数据行
索引类型
- 主键索引。
数据列不允许重复,不允许为NULL,一个表只能有一个主键
ALTER TABLE table_name ADD PRIMARY KEY (column);
- 普通索引
MySQL中基本索引类型,没有什么限制,允许在定义索引的列中插入重复值和NULL值。一个表允许多个列创建普通索引。
ALTER TABLE table_name ADD INDEX index_name (column);
- 唯一索引
索引列中的值必须是唯一的,但是允许NULL值。建立唯一索引的目的大部分时候都是为了该属性列的数据的唯一性,而不是为了查询效率。一个表允许多个列创建唯一索引。
ALTER TABLE table_name ADD UNIQUE (column);
- 全文索引
主要是为了快速检索大文本数据中的关键字的信息。字段长度比较大时,如果创建普通索引,在进行like模糊查询时效率比较低,这时可以创建全文索引,基于倒排索引,类似于搜索引擎。MyISAM存储引擎支持全文索引,InnoDB 存储引擎在 MySQL 5.6.4 版本中也开始支持全文索引。
ALTER TABLE table_name ADD FULLTEXT (column);
- 联合索引
指多个字段上创建的索引,只有在查询条件中使用了创建索引时的第一个字段,索引才会被使用。使用组合索引时遵循最左前缀原则。
主键索引、普通索引、唯一索引等都可以使用多个字段形成组合索引。例如,ALTER TABLE table_name ADD INDEX index_name ( column1, column2, column3
- 前缀索引
.在文本类型如BLOB、TEXT或者很长的VARCHAR列上创建索引时,可以使用前缀索引,数据量相比普通索引更小,可以指定索引列的长度,但是数值类型不能指定。
ALTER TABLE table_name ADD KEY(column_name(prefix_length)) - 空间索引
MySQL在5.7之后的版本支持了空间索引,而且支持OpenGIS几何数据模型。MySQL在空间索引这方面遵循OpenGIS几何数据模型规则。
索引存储原理
https://www.jianshu.com/writer#/notebooks/54722559/notes/118411269
索引引擎类型及区别
调优
MySQL调优环节主要包括:
- 数据库配置调优
- 硬件及操作系统调优
- SQL语句查询优化
查询优化
进行查询优化首选需要了解查询优化器,查询优化器是MySQL中的一个关键组件,它负责分析查询语句并生成最优的查询执行计划
查询优化器的工作流程
查询优化器的工作流程:
1.解析查询语句:查询优化器首先会对查询语句进行解析,将其转化为内部的查询树或逻辑表达式。
2.查询重写:优化器可能对查询进行重写,以优化查询结构和查询条件。
3.查询优化:优化器根据统计信息、索引和其他相关信息,生成不同的执行计划,并评估每个执行计划的代价。
4.选择最优执行计划:优化器选择代价最低的执行计划,并生成执行计划的执行指令。
5.执行查询:MySQL的执行引擎根据优化器生成的执行计划,执行查询并返回结果。查询优化器的优化过程:
1.查询预估:优化器根据统计信息和查询条件预估查询结果集的大小,以决定使用哪个执行计划。
2.索引选择:优化器根据索引的选择性和列的选择性,决定是否使用索引以及使用哪个索引。
3.连接顺序选择:对于涉及多个表的查询,优化器选择合适的表连接顺序,以减少中间结果集的大小和连接操作的代价。
4.子查询优化:优化器尝试将子查询转化为连接操作或应用优化的技术,以减少子查询的执行次数和开销。
5.重写查询:优化器可能对查询进行重写,使用等价的查询结构,以改进查询的执行效率。统计信息的使用:
1.表统计信息:优化器使用表的统计信息,如行数、列的唯一值数量等,来估计查询的选择性和代价。
2.索引统计信息:优化器使用索引的统计信息,如索引的选择性、平均数据页的大小等,来评估索引的使用代价。
3.更新统计信息:统计信息会随着数据的变化而变化,优化器可能需要定期更新统计信息,以保持查询优化的准确性。
查询优化器的影响因素:
4.查询复杂度:查询的复杂度越高,优化器需要考虑的执行计划越多,优化的时间和代价也会增加。
5.数据分布:数据的分布情况会影响优化器的索引选择和连接顺序的决策,不同的数据分布可能导致不同的执行计划。
优化查询语句
优化查询语句
创建适当的索引
1.选择合适的列
2.考虑列的选择性
3.避免过多的索引
4.考虑复合索引
5.索引长度
6.考虑查询的排序需求
7.监测和评估索引的效果
8.定期维护索引优化数据模型和表结构
监测和分析查询性能
定期维护和优化
参考博文:https://blog.csdn.net/qq_40991313/article/details/131059110
事务
事务定义、特性、隔离级别
https://blog.csdn.net/wang_luwei/article/details/119619105
事务实现底层原理、锁
https://zhuanlan.zhihu.com/p/148035779
幻读
https://blog.csdn.net/m0_71777195/article/details/126968432
不同隔离级别对应的锁
https://blog.csdn.net/IT_Holmes/article/details/122641669
几种日志、主从模式、一条SQL的执行过程
https://zhuanlan.zhihu.com/p/354255965
mysql为什么采用innodb做默认引擎
https://blog.csdn.net/oschina_40730821/article/details/105783874
常见的SQL注入和措施
https://blog.csdn.net/Hehuyi_In/article/details/107976593