InnoDB架构
整体架构图
内存结构
缓冲池
- 缓冲池:主内存中一块区域,LinkedList结构,元素为page,每个page可能包含多个row;缓冲区数据可以被直接使用,所以专用服务器时,内存分配达80%;
- LRU(least recent use)算法及配置
- 链表由midpoint分割为新区和老区,默认比例5:3;
- innodb_old_blocks_pct 可配置新老区比例,区间(5-95),默认37;
- innodb_old_blocks_time 老区时间,默认1000(毫秒),确保首次访问后在老区待的时间,时间越大失效越快,超过此时间再访问及进入新区;
- 每次读取数据插入到缓冲池时,插入数据在老区的头部;当超过innodb_old_blocks_time时间,访问老区的数据时,数据插入到新区头部;
思考问题:
- 既然每次访问都会需要新空间,并释放旧数据;大数据量查询时,如何提高缓存数据使用效率?比如因为mysqldump导致大部分的高热数据被清理;
缓冲池配置
- 预读
- 线性预读 innodb_read_ahead_threshold,区间(0-64),默认值为56;顺序读取当前扩展区多少页时,触发预读请求;在没有此参数时,仅当读取当前扩展区最后一页时,才计算是否需要对整个扩展区进行下一步预读;
- 随机预读 innodb_random_read_ahead,值为ON/OFF;不管这些页面的读取顺序如何。如果在缓冲池中找到同一范围的13个连续页面;
- 缓冲池刷新
- 自适应刷新算法
- 保存和恢复缓冲池状态(减少重启服务预热时间)
- innodb_buffer_pool_dump_pct 存储最近使用的缓存百分比
- 内容:仅保存所需的表空间ID和页面ID到磁盘
更改缓冲区
- 说明:是一种特殊的数据结构,当二级索引页(secondary index)不在缓冲池中时,它们会缓存这些更改;
- 作用:与聚簇索引不同,二级索引通常是非唯一的,并且二级索引中的插入以相对随机的顺序发生。同样,删除和更新可能会影响索引树中不相邻的二级索引页。当稍后通过其他操作将受影响的页读入缓冲池时,合并缓存的更改将避免从磁盘将辅助索引页读入缓冲池所需的大量随机访问I / O;
-
配置更改缓冲区
- innodb_change_buffering 配置参数来控制执行更改缓冲的级别:
- all(默认值) 配置参数来控制执行更改缓冲 的程度
- none 缓冲区删除标记操作
- inserts 缓冲区删除标记操作
- deletes 缓冲区删除标记操作
- changes 缓冲插入和删除标记操作
- purges 缓冲在后台发生的物理删除操作
- innodb_change_buffer_max_size 默认25,更改缓冲区的最大大小配置占缓冲池总大小的百分比;
- innodb_change_buffering 配置参数来控制执行更改缓冲的级别:
- 注意:当有许多受影响的行和许多二级索引要更新时,更改缓冲区合并有可能需要几个小时。在此期间,磁盘I / O会增加,这可能会导致磁盘绑定查询的速度大大降低。提交事务之后,甚至在服务器关闭并重新启动之后,更改缓冲区合并也可能继续发生
自适应哈希索引
- 使用索引关键字的前缀构建哈希索引。该前缀可以是任何长度,并且可能仅是B树(索引)中的某些值。
- 哈希索引是根据对经常访问的索引页面的需求而建立的。
日志缓冲区
- 说明 日志缓冲区是用于保存要写入磁盘上的日志文件的数据。较大的日志缓冲区使大型事务可以运行,而无需在事务提交之前将重做日志数据写入磁盘。因此,如果您有更新,插入或删除许多行的事务,则增加日志缓冲区的大小可以节省磁盘I / O。
-
配置
- 日志缓冲区大小由innodb_log_buffer_size变量定义 。默认大小为16MB。
- 日志缓冲区的内容会定期刷新到磁盘 innodb_flush_log_at_timeout (值为1~2700)。
- innodb_flush_log_at_trx_commit 将日志缓冲区的内容写入并刷新到磁盘的方式
- 0 每秒写入一次日志并将其刷新到磁盘。尚未刷新日志的事务可能会在崩溃中丢失。
- 1 默认设置(满足ACID),日志在每次事务提交时写入并刷新到磁盘。
- 2 在每次事务提交后写入日志,并每秒刷新一次到磁盘。尚未刷新日志的事务可能会在崩溃中丢失。
-
落磁盘流程
-
落磁盘方式