mysql 的一条 sql 是如何执行的
说明:mysql8.0 版本已经移除了查询缓存。
通信协议
mysql 是支持多种通信协议的,可以使用同步/异步的方式,支持长链接/短链接。
通信类型
-
同步
- 同步通信依赖于被调用方,受限于被调用方的性能。当应用操作数据库,线程会阻塞,等待数据库的返回结果。
- 同步方式一般只能做到一对一。
-
异步
- 异步可以避免线程的阻塞等待,但是不能减少 sql 的执行时间。
- 异步在高并发的情况下,会为每一个 sql 的执行创建一个连接,避免数据混乱。缺点是服务器压力会变大(线程间的切换会占用 cpu 资源)。
由于异步方式比较复杂,对服务器压力较大,所以一般情况下都会采用同步的方式。
连接方式
- 长连接:长连接可以保持打开,减少服务端创建和释放连接的消耗。但是长时间不关闭的情况下会消耗内存,mysql 默认超时时间是 28800s。
- 短连接:短连接是操作完成后立刻 close 掉。
通信方式
- 单工:在两台计算机之间通信的时候,数据传输是单向的。
- 半双工:在两台计算机之间通信的时候,数据传输是双向的,但是同一时间只能有一台发送数据,一台接受数据,不能两台同时发送或接收数据。
- 全双工:全双工就是可以同时发送或接收数据传输。
mysql 采用的通信方式是半双工的通信方式。
查询缓存
查询缓存是 mysql 内部自带的一个缓存模块。mysql 缓存模块默认是关闭的,不推荐使用,主要原因是 mysql 自带的缓存应用场景有限,它要求 sql 语句必须完全一致,其次表里面的数据发生变化,这张表的缓存就会全部失效。一般情况下缓存都是交给 ORM 框架或者其他独立缓存服务的。mysql8.0 版本已经将缓存模块移除了。
语法解析和预处理
语法解析(Parser)
语法解析第一步是将一条完整的 sql 打散成为一个一个单词,这步也被称作为词法解析。
然后才会进行语法解析,语法解析会对 sql 做一些语法检查,然后根据 sql 的语法规则,生成一个数据结构,也就是解析树(select_lex)
预处理(Preprocessor)
预处理会检查生成的解析树,解决解析器无法解析的语义。例如:它会检查表和表的列是否存在,检查别名等。
查询优化器
一条 sql 语句会存在多种执行方式,最终以那种方式来执行是查询优化器来决定的。
查询优化器的目的就是根据解析树生成的不同的执行计划(Execution Plan),然后选择一种最优的执行计划,mysql 里面使用的是基于开销(cost)的优化器,那种开销最小,就使用那种。
优化器最终会把解析树变成一个查询执行计划,查询执行计划一个数据结构。这个执行计划不一定是最优的结果,因为 mysql 也有可能覆盖不到所有的执行计划。
注意:当使用 Explain 查看执行计划的时候,这个结果不一定是最终的执行方式。
存储引擎
在关系型数据库里,数据是存放在 Table 里的,这个 Table 在存放数据的同时,还要组织数据结构,这个存储结构是由存储引擎决定的,所以我们也可以把存储引擎叫做表类型。
在 mysql 里是支持多种存储引擎的,他们是可以替换的,所以也叫做插件式的存储引擎。
存储引擎列表
注意:这里引用mysql 官网
MyISAM
通常情况下应用于只读或者以读为主的工作。适合只读类的数据分析项目。
特点
- 支持表级别的锁,插入和更新都会锁表,所以限制了读/写的性能。
- 拥有较高的插入和查询速度。(例如,可以先设定存储引擎为 MyISAM,然后插入 100W 的数据,然后在修改存储引擎为 InnoDB 来提高效率)
- 存储了表的行数,count 速度快。
- 不支持事物。
InnoDB
Mysql5.7 版本中的默认存储引擎。适合更新较频繁的表,存在并发读写或者有事物的场景。
特点
- 支持事物、外键,所以数据的完整性,一致性更高。
- 支持行锁和表锁。
- 支持读写并发,写不阻塞读(MVCC)。
- 特殊的索引存储方式,减少 I/O,提高查询效率
Memory
将所有数据存储在 RAM 中来提高查找非关键数据的速度。适合做临时表。
特点
- 优点:数据存在在内存中,读写速度快,
- 缺点:当数据库重启或者断电情况下,数据会全部消失。
执行引擎
� 执行引擎是使用执行计划来操作存储引擎,它利用存储引擎提供的 API 来完成操作,最后饭数据返回给客户端。