MySQL逻辑架构图
从图中就可以看出来MySQL大体架构分了两层,server层和存储引擎。
server层有管理数据库连接,控制客户端权限的连接器、提高查询性能的查询缓存、对SQL语句进行解析的分析器、执行SQL计划生成的优化器、根据计划操作存储引擎接口取数据的执行器。
存储引擎则负责数据的存储和提取。存储引擎是插件式的架构模式,支持InnoDB,MyISAM、Memory等多个引擎。
server层
连接器
我们访问数据库首先接触的是连接器,连接器负责跟客户端建立连接、获取权限、维持、管理连接。连接命令如下:
mysql -h连接地址 -P端口 -u用户名 -p密码
如用户名或密码不对,会返回错误"Access denied for user"的错误。如正确的话,连接器会在权限表里查出你所拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖与此时读到的权限。(注意:也就是说,当一个用户成功建立连接后,权限的变更不会影响已经存在连接的权限,只有建立新的连接才会使用新的权限设置。)
查看连接的信息
show processlist
结果:sleep为空闲的连接
客户端如长时间没有动静,连接器会自动断开,默认为8小时,有系统变量 wait_timeout 控制。
客户端连接在断开后进行请求,会返回错误:Lost connection to MySQL server during query。要继续执行请求必须重连。
在数据库中有长连接和短连接之分,因建立连接的过程比较复杂,所以应当减少建立连接的动作,也就是尽量使用长连接。
但长连接一直运行,资源会占用越来越多,内存会涨得特别快。只有断开连接资源才能释放。
对于这个问题,作者给出了两种方案。
1. 定期断开长连接,要查询再重连。
2. 如果MySQL版本是 5.7或更新,可使用mysql_reset_connection函数来重新初始化连接资源。
查询缓存
连接建立成功后,第二步就是:查询缓存。
当我们执行查询SQL语句时,会把SQL语句作为key,结果集作为value,存入缓存,等下次来请求直接取缓存,就不用后面的复杂操作了,从而提高性能。但在MySQL8.0之后会彻底删除这个功能。
为什么要删除?因为这个功能弊大于利。
1. 要命中缓存,SQL语句必须一模一样,例如 SELECT id FROM user 与 select id from user就不行,特别是用now()时间函数,就更加不行了。
2. 当一个表的数据有更新时,关于这个表所有的缓存都会被清除,对于更新频繁的系统关掉这个功能,性能还比开启要好些,这样就不会去查询判断是否有缓存。
一般来说查询缓存用在长时间不变的静态表里面会比较好。
#MySQL查询缓存参数 0关闭 1打开 2按需求来 表示只要select中明确指定SQL_CACHE才缓存
select SQL_CACHE * from T where ID=10;
show global VARIABLES like 'query_cache_type';
#与查询缓存相关的系统变量
#have_query_cache 表示这个MySQL版本是否支持查询缓存
#query_cache_limit 表示单个结果集所被允许缓存的最大值
#query_cache_min_res_unit 每个被缓存的结果集要占用的最小内存
#query_cache_size 用于查询缓存的内存大小
show global variables like 'have_query_cache';
show global variables like 'query_cache_limit';
show global variables like 'query_cache_min_res_unit';
show global variables like 'query_cache_size';
#如何监控查询缓存的命中率
#查询缓存目前剩余空间大小
show status like 'qcache_free_memory';
#查询缓存命中次数
show status like 'qcache_hits';
#查询未命中时插入缓存的次数
show status like 'qcache_inserts';
分析器
分析器做了两件事情,一件是词法分析、一件是语法分析。
词法分析,分析的是每个字符串是什么意思,比如 select id from T;"select"代表是一个查询语句、"id"为一个列,"T"是一个表名。
语法分析,分析的是看你的说SQL语句是否符合MySQL的语法,如不符合返回 “You have an error in your SQL syntax” ,一般语法错误会提示第一个出现错误的位置,所有只要关注"use near"后面的内容。
优化器
优化器做的是传过来的SQL语句应该怎样执行,以什么样的顺序执行,索引怎么选择。举一个栗子:
select * from t1 join t2 using(ID) where t1.c=10 and t2.d=20;
像这个SQL语句就有两种运行模式,一种是从t1表取c列等于10,再关联t2表,再去d列等于20的数据,还有一种是从t2表d列等于20,再关联t1表,再去取c列等于10的数据,虽然结果是一样的,但效率有所不同。包括表里有多个索引,索引会怎么选择,会不会选择错误等后面的章节都会介绍。
执行器
MySQL通过分析器知道你要做什么,优化器知道怎么做,接下来就是执行了,在执行之前会check一下你有没有权限查询这张表(包括查询缓存的时候也会验证你的权限),这里有个问题就是为什么检查权限要放在执行器来做,而不在分析器的时候就check掉?作者的回答是:有些时候,SQL语句要操作的表不只是SQL字面上那些。比如如果有个触发器(触发器是由某个事件激活调用程序,比如insert、update、delete,可以用来做数据同步),得在执行器阶段(过程中)才能确定。优化器阶段前是无能为力的。
检查完权限后,执行器会调用引擎里面定义好的接口,去获取符合条件的数据,判断条件从第一行到最后一行(题外话,当你获取的数据确定只有一行的时候,可加上limit 1,这样就不会进行后面的判断)。
在数据库的慢查询日志(记录超过规定时间的查询SQL语句)中有一个字段叫 rows_examined ,表示在执行过程中扫描了多少行,但作者说在有些场景下扫描行数与这个字段并不是完全相同的。后面的篇章会讲。
show variables like 'slow_query%';
#是否开启慢查询日志
slow_query_log
#慢查询日志文件地址
slow_query_log_file
#超过多少秒日志才记录
show variables like 'long_query_time';
小结
对于小编说的不对的地方请读者多理解,多包涵,还是推荐大家去看看原文章(极客时间-MySQL实战45讲),作者是前阿里资深技术专家,还是有点东西的。