前文笔者通过一条语句的执行,从整体上讲解了InnoDB存储引擎的架构,让大家对一条SQL语句的执行过程中,都有哪些操作有了完备的了解。
InnoDB存储引擎处理一条数据,无论是查询还是修改,都需要先从磁盘加载到内存中,然后在内存中对这条数据进行相关的操作,这块内存就是Buffer Pool。可以说Buffer Pool是整个InnoDB最重要的组件了。
这篇文章笔者就顺着前文的思路,深入剖析下Buffer Pool内部是什么样的结构,又是怎么运转的。由于这个主题内容比较多,为了不让读者感觉枯燥,每篇文章会限制下篇幅,会分为多篇文章来讲解。
Buffer Pool大小
Buffer Pool是MySQL server内部分配的一块内存,这块内存肯定是有大小的,不可能随意设置。
Buffer Pool默认大小是128M,一个MySQL server可以配置多个Buffer Pool实例,实际生产环境中可以根据物理内存大小,对Buffer Pool进行调整。比如想设置Buffer Pool大小为2G,可以在my.conf中修改配置。
[server]
innodb_buffer_pool_size = 2147483648
笔者随便找了台公司的测试机,执行下面的语句,查看它上面的Buffer Pool配置,共有4个实例,总共大小是8G。
SHOW VARIABLES LIKE "%innodb_buffer%"
缓存页:Buffer Pool的最基础组成部分
假设现在我们手上有一个MySQL数据库了,里边给Buffer Pool分配了一块内存,那么数据是如何放在Buffer Pool中的?
我们对数据库最直观的感觉就是,表、行、字段,每个数据库有很多张表,每张表有很多行记录,每行记录有很多个字段。所以往往会觉得数据是一行一行的放在Buffer Pool中的吗?
没这么简单!
数据库最终所有的数据,都是要写入磁盘文的,在磁盘文件里存放数据的物理格式就是数据页,那么大量的数据页在磁盘文件里是怎么存储的呢?
大量的数据页是按顺序一页一页存放的,每个页大小是16K,两两相邻的数据页之间会采用双向链表的格式互相引用,这个链表指针可以理解为磁盘上存储的地址,大致看起来如下图所示。
InnoDB也抽象出来了一个缓存页的概念,它把很多行数据放在一个缓存页里。
默认情况下磁盘上的数据页和InnoDB的缓存页是一 一对应的,都是16KB,一个数据页对应一个缓存页。
当我们要更新一行数据时,数据库就会找到这行数据所在的数据页,然后从磁盘文件把这行数据所在的数据页加载到Buffer Pool中去。
也就是说,Buffer Pool中存放的是一个一个的数据页。如下图所示:
Buffer Pool中存放的一个一个的数据页,我们通常叫做缓存页,毕竟Buffer Pool是一个缓冲池,里面的数据是从磁盘文件缓存到内存里去的。
对于每个缓存页,它都有一个描述信息,这个描述信息就是用来描述描述这个缓存页的。比如,这个数据页的编号、所属的表空间、这个缓存页在Buffer Pool中的地址等等。
这个描述信息本身也是一块数据,在Buffer Pool中,大概长这个样子。
描述数据是用来描述缓存页的,本身比较小,不会占用多少Buffer Pool空间。
总结:
本文初步讲解了下Buffer Pool的基本数据单元:缓存页,缓存页与磁盘文件的数据页是一一对应的,都是16K大小。后面讲继续讲解这些缓存页在Buffer Pool中都是如何组织起来的。
END