MySQL 底层是分层架构 + 插件式存储引擎的核心设计，以 InnoDB 为默认引擎，通过B + 树索引、MVCC、WAL 日志、Buffer Pool等机制实现高性能、事务安全与高并发。下面从整体架构、核心组件、存储引擎、索引、事务与日志、内存管理、并发控制等维度，完整拆解 MySQL 底层原理。

一、MySQL 整体分层架构（四层）

从上到下依次为连接层、服务层、存储引擎层、文件系统层，层间通过标准 API 解耦，存储引擎可插拔。
1. 连接层（最上层）
核心职责：处理客户端连接、身份验证、权限校验、连接池管理。
关键组件：
连接器：建立 TCP 连接，验证用户名 / 密码，分配线程。
连接池：复用连接，减少频繁创建 / 销毁开销。
交互：接收 SQL 请求，转发给服务层；返回结果给客户端。
2. 服务层（核心层，所有引擎共用）
负责 SQL 处理、优化、执行调度，不关心底层存储细节。
SQL 接口：接收 SQL 命令（DDL/DML/DQL），返回结果集。
解析器：语法解析、语义校验，生成解析树（检查语法 / 表 / 字段合法性）。
查询优化器（CBO）：基于成本（IO/CPU/ 内存）选择最优执行计划（如选索引、JOIN 顺序）。
执行器：调用存储引擎 API 执行计划，做权限检查、数据过滤 / 聚合 / 排序，返回结果。
缓存 / 缓冲：查询缓存（8.0 已移除）、表缓存、权限缓存。
事务管理器：协调事务提交 / 回滚，管理隔离级别。
3. 存储引擎层（数据存储核心，插件式）
MySQL 最具特色的设计，数据存储、索引、事务、锁、MVCC、崩溃恢复均由引擎实现。
核心 API：Handler API，服务层通过统一接口调用引擎能力。
主流引擎：
InnoDB（默认，5.5+）：事务 ACID、行锁、MVCC、聚簇索引、崩溃恢复，适合高并发 / 金融 / 电商。
MyISAM：表锁、非事务、非聚簇索引，适合读多写少 / 报表。
Memory：内存存储、哈希索引，适合临时表 / 缓存。
Archive：高压缩、只追加，适合日志归档。
4. 文件系统层（物理存储）
数据 / 索引 / 日志以文件形式持久化到磁盘。
InnoDB 文件：.ibd（独立表空间，含数据 + 索引）、ibdata1（共享表空间）、redo log、undo log。
MyISAM 文件：.MYD（数据）、.MYI（索引）、.frm（表结构）。
日志文件：binlog、error log、slow query log等。

二、InnoDB 核心底层原理（重点）

InnoDB 是 MySQL 默认引擎，支撑事务、高并发、崩溃恢复，以下是其底层核心机制。
1. 逻辑存储结构（从大到小）
表空间（Tablespace）：最大逻辑单元，分共享 / 独立表空间。
段（Segment）：数据段、索引段、回滚段。
区（Extent）：64 个连续页，默认 1MB（16KB×64），减少磁盘碎片。
页（Page）：最小 I/O 单元，默认 16KB，分数据页、索引页、undo 页、change buffer 页等。
行（Row）：数据行，按格式（Compact/Redundant/Dynamic/Compressed）存储。
2. 内存结构（Buffer Pool 体系）
核心是Buffer Pool，缓存磁盘数据页，大幅减少磁盘 IO。
Buffer Pool：
缓存数据页 + 索引页，默认大小由innodb_buffer_pool_size控制（建议物理内存 50%-70%）。
采用优化版 LRU：分 young 区（热数据，5/8）、old 区（冷数据，3/8），避免全表扫描淘汰热数据。
脏页：内存中被修改、未同步到磁盘的页，由后台线程刷盘。
Change Buffer（更改缓冲区）：
针对非唯一二级索引的写操作（INSERT/UPDATE/DELETE），先缓存到 Change Buffer，批量合并后再刷盘，减少随机 IO。
日志缓冲区（Log Buffer）：缓存 redo log，默认 8MB，满了或事务提交时刷盘。
自适应哈希索引（AHI）：监控热点查询，自动建哈希索引加速等值查询（不支持范围）。
3. 索引底层（B + 树，聚簇索引）
InnoDB 索引基于B + 树，是查询性能的核心。
聚簇索引（主键索引）：
叶子节点存储完整数据行，数据与索引物理绑定。
每张表必有聚簇索引（无主键则自动生成隐藏主键）。
二级索引（辅助索引）：
叶子节点存储主键值，查询需回表（通过主键再查聚簇索引）。
覆盖索引：索引包含查询所需所有字段，避免回表。
B + 树优势：
所有数据在叶子节点，形成有序链表，范围查询高效。
非叶子节点只存键，树更矮，IO 次数更少。
4. 事务与 ACID 实现（核心机制）
InnoDB 通过redo log、undo log、MVCC、锁实现 ACID。
原子性（A）：undo log 记录修改前数据，事务失败则回滚。
一致性（C）：事务前后数据完整性约束不变，由锁 + MVCC + 日志保障。
隔离性（I）：MVCC + 锁实现 4 种隔离级别（读未提交 / 读已提交 / 可重复读 / 串行化），默认可重复读。
持久性（D）：redo log 记录物理页修改，WAL（Write-Ahead Logging）机制：先写日志，再写数据，崩溃后通过 redo log 恢复。
5. 三大核心日志（数据安全基石）

image.png

并发控制（MVCC + 锁）
MVCC（多版本并发控制）：
每行数据隐含trx_id（事务 ID）、roll_pointer（回滚指针）。
读已提交 / 可重复读通过快照读（读取历史版本）实现读写不阻塞，提升并发。
锁机制：
行级锁：共享锁（S）、排他锁（X），锁粒度小，并发高。
间隙锁（Gap Lock）+ Next-Key Lock：可重复读下解决幻读。
意向锁：表级意向锁，提升锁检查效率。
崩溃恢复（Crash Recovery）
MySQL 宕机重启后，InnoDB 自动做恢复：
检查 redo log，将未刷盘的脏页重做。
回滚未提交事务（通过 undo log）。
保证数据一致性与持久性。

三、SQL 执行底层流程（以 SELECT 为例）

客户端→连接层：建立连接，发送 SQL。
连接层→服务层：SQL 接口接收，解析器生成解析树。
优化器：生成最优执行计划（选索引、JOIN 顺序）。
执行器：调用 InnoDB API，先查 Buffer Pool，命中则返回；未命中则从磁盘加载数据页到 Buffer Pool。
InnoDB：通过 B + 树索引定位数据，返回给执行器。
执行器：过滤 / 聚合 / 排序，返回结果给客户端。

四、核心底层机制对比（InnoDB vs MyISAM）

image.png

五、底层性能优化核心思路

Buffer Pool 优化：合理设置innodb_buffer_pool_size，避免频繁磁盘 IO。
索引优化：建主键 / 覆盖索引，避免回表，减少索引冗余。
事务优化：短事务，减少锁持有时间，避免大事务。
日志优化：调整 redo log 大小、刷盘策略，平衡性能与安全。
SQL 优化：避免全表扫描，用 EXPLAIN 分析执行计划。
MySQL 底层的核心是分层解耦 + InnoDB 引擎的 B + 树、MVCC、WAL、Buffer Pool，理解这些机制是掌握 MySQL 性能调优、故障排查、架构设计的基础。

mysql底层架构