Mysql基本架构图
连接器
- 连接器负责跟客户端建立连接,获取权限、维持和管理连接
1、用户名密码验证
2、查询权限信息,分配对应的权限
3、可以使用show processlist查看现在的连接
4、如果太长时间没有动静,就会自动断开,通过wait_timeout控制,默认8小时 - 连接可以分为两类
1、长连接:推荐使用,但是要周期性的断开连接
2、短连接:指的是每次执行完很少的几次查询就断开连接,下次查询再重新建立一个。
查询缓存(MySQL8.0 版本后移除)
- 当执行查询语句的时候,会先去查询缓存的结果,之前执行过的sql语句及其结果可能以Key-value的形式存储在缓存中,如果额能找到则直接返回,如果找不到,就继续执行后续的阶段。
但是不推荐使用查询缓存:
1、查询缓存的失效比较频繁,只要表更新,缓存就会清空
2、缓存对应更新的数据命中率比较低
分析器
- 词法分析:Mysql需要把输入的字符串进行识别
- 语法分析
1、根据语法规则判断这个SQL语句是否满足Mysql的语法,如果不符合就会报错 “You have an error in your SQL synta”
优化器
- 在具体执行SQL语句之前,要先经过优化器的处理
1、当表中有多个索引的时候,决定用哪个索引
2、当SQL语句需要做多表关联的时候,决定表的连接顺序 - 不同的执行方式对SQL语句的执行效率影响很大
1、RBO:基于规则的优化
2、CBO:基于成本的优化
Redo日志-innodb存储引擎的日志文件
- 当发生数据修改的时候,innodb引擎会将记录写到redo log中,并更新内存,此时更新就算是完成了,同时innodb引擎会在何时的时机将记录操作到磁盘中
- Redo log是固定大小的,是循环写入的过程
-
有了redo log之后,innodb就可以保证即使数据库发生异常重启,之前的记录也不会丢失,叫做crash-safe
疑惑?
-
既然要避免IO,为什么写redo log的时候不会造成io的问题?
undo log
- undo log是为了实现事务的原子性,在Mysql数据库InnoDB存储引擎中,还用undo log来实现多版本并发控制(MVCC)
- 在操作任何数据之前,首先将数据备份到一个地方(这个存储数据备份的地方称为 undo log)。然后进行数据的修改。如果出现了错误或者用户执行了Rollback语句,系统可以利用 undo log中的备份将数据恢复到事务开始之前的状态
- undo log是逻辑日志,可以理解为:
1、当delete一条记录时,undo log中会记录一条对应的inser记录
2、当insert一个记录时,undo log中会记录一条对应的delete记录
3、当update一条记录时,它记录一条对应相反的update记录
bin log 服务端的日志文件
- bin log时server层的日志,主要做mysql功能层面的事情
- 与redo日志的区别
1、redo是innodb独有的,bin log是所有引擎都可以使用的
2、redo是物理日志,记录的是在某一个数据页上做了什么修改,bin log是逻辑日志,记录的是这个语句的原始逻辑
3、redo是循环写的,空间会用完,bin log是可以追加的,不会覆盖之前的日志信息
bin log
- bin log 中会记录所有的逻辑,并且采用追加写的方式
- 一般在企业中数据库会有备份系统,可以定期执行备份,备份呢的周期可以自己设置
- 恢复数据的过程:
1、找到最近一次的全量备份数据
2、从备份的时间点开始,将备份的bin log取出来,重放到要恢复的那个时刻
数据更新的流程
执行流程
1、执行器先从引擎中找到数据,如果在内存中直接返回,如果不在内存中,查询后返回
2、执行器拿到数据之后会先修改数据,然后条用引擎接口重新写入数据
3、引擎将数据更新到内存,同时写数据到redo中,此时处于prepare阶段,并通过执行器执行完成,随时可以操作
4、执行器生成这个操作的bin log
5、执行器调用引擎的事务提交接口,引擎把刚刚写完的redo改成commit状态,更新完成
redo log的两阶段提交
- 先写redo log后写binlog:
假设在redo log写完,binlog还没有写完的时候,MySQL进程异常重启。由于我们前面说过的,redo log写完之后,系统即使崩溃,仍然能够把数据恢复回来,所以恢复后这一行c的值是1。但是由于binlog没写完就crash了,这时候binlog里面就没有记录这个语句。因此,之后备份日志的时候,存起来的binlog里面就没有这条语句。然后你会发现,如果需要用这个binlog来恢复临时库的话,由于这个语句的binlog丢失,这个临时库就会少了这一次更新,恢复出来的这一行c的值就是0,与原库的值不同。 - 先写binlog后写redo log:
如果在binlog写完之后crash,由于redo log还没写,崩溃恢复以后这个事务无效,所以这一行c的值是0。但是binlog里面已经记录了“把c从0改成1”这个日志。所以,在之后用binlog来恢复的时候就多了一个事务出来,恢复出来的这一行c的值就是1,与原库的值不同。