InnoDB-数据页

前言

大家好,我是xicheng。最近天气变凉,注意身体。现在继续更新MySQL的InnoDB的相关文章,InnoDB的知识脑图如下所示,大家坐稳了。


InnoDB页简介

默认是16KB。大小只能在第一次初始化MySQL数据目录时指定。是InnoDB用于存放数据与索引的页。

InnoDB数据页大体结构

名称 中文名 大小(字节) 简单描述
File Header 文件头 38 页的一些通用信息
Page Header 页头 56 数据页专有的一些信息
Infimum + SupreMum 最小记录和最大记录 26 两个虚拟的行记录
User Records 用户记录 不确定 实际存储的行记录内容
Free Space 空闲空间 不确定 页中尚未使用的空间
Page Directory 页目录 不确定 页中某些记录的相对位置
File Trailer 文件尾部 8 检验页是否完整

如下图所示


File Header

用来记录页的一些头信息。针对各种类型的页都通用File Header属性如下表所示。*为重点掌握的属性。

名称 占用空间(字节) 描述
*FIL_PAGE_SPACE_OR_CHKSUM 4 ⻚的校验和(checksum值)
*FIL_PAGE_OFFSET 4 ⻚号
*FIL_PAGE_PREV 4 上⼀个⻚的⻚号
*FIL_PAGE_NEXT 4 下⼀个⻚的⻚号。通过该属性与FIL_PAGE_PREV属性,实现了B+树中,叶子结点是由双向链表构成,能快速遍历的特性。
FIL_PAGE_LSN 8 ⻚⾯被最后修改时对应的⽇志序列位置
*FIL_PAGE_TYPE 2 该⻚的类型。具体页类型在下表中展示
FIL_PAGE_FILE_FLUSH_LSN 8 仅在系统表空间的⼀个⻚中定义,代表⽂件⾄少被刷新到了对应的LSN值
FIL_PAGE_ARCH_LOG_NO_OR_SPACE_ID 4 ⻚属于哪个表空间

页类型,*为重点掌握的页类型。

类型名称 十六进制 描述
FIL_PAGE_TYPE_ALLOCATED 0x0000 最新分配,还没使⽤
*FIL_PAGE_UNDO_LOG 0x0002 Undo⽇志⻚
*FIL_PAGE_INODE 0x0003 段信息节点
*FIL_PAGE_IBUF_FREE_LIST 0x0004 Insert Buffer 空闲列表
FIL_PAGE_IBUF_BITMAP 0x0005 Insert Buffer 位图
*FIL_PAGE_TYPE_SYS 0x0006 系统⻚
FIL_PAGE_TYPE_TRX_SYS 0x0007 事务系统数据
FIL_PAGE_TYPE_FSP_HDR 0x0008 表空间头部信息
FIL_PAGE_TYPE_XDES 0x0009 扩展描述⻚
FIL_PAGE_TYPE_BLOB 0x000A BLOB⻚
*FIL_PAGE_INDEX 0x45BF 索引⻚,也就是我们所说的数据⻚

Page Header

上文列举除了很多种类型的页。其中数据页的属性如下表所示。

状态名称 大小(字节) 描述
PAGE_N_DIR_SLOTS 2 在⻚⽬录中的槽数量,在Page Directory中会讲到
PAGE_HEAP_TOP 2 还未使⽤的空间最⼩地址,也就是说从该地址之后就是Free Space
PAGE_N_HEAP 2 本⻚中的记录的数量(包括最⼩和最⼤记录以及标记为删除的记录)
PAGE_FREE 2 第⼀个已经标记为删除的记录地址(各个已删除的记录通过next_record也会组成⼀个单链表,这个单链表中的记录可以被重新利⽤)
PAGE_GARBAGE 2 已删除记录占⽤的字节数
PAGE_LAST_INSERT 2 最后插⼊记录的位置
PAGE_DIRECTION 2 记录插⼊的⽅向
PAGE_N_DIRECTION 2 ⼀个⽅向连续插⼊的记录数量
PAGE_N_RECS 2 该⻚中记录的数量(不包括最⼩和最⼤记录以及被标记为删除的记录)
PAGE_MAX_TRX_ID 8 修改当前⻚的最⼤事务ID,该值仅在⼆级索引中定义
PAGE_LEVEL 2 当前⻚在B+树中所处的层级
PAGE_INDEX_ID 8 索引ID,表示当前⻚属于哪个索引
PAGE_BTR_SEG_LEAF 10 B+树叶⼦段的头部信息,仅在B+树的根⻚面定义
PAGE_BTR_SEG_TOP 10 B+树⾮叶⼦段的头部信息,仅在B+树的根⻚面定义

Infimum Record和Supremum Record

每个数据页都有两个虚拟的行记录,用来限定记录的边界。Infimum比该页的任何主键值都小。Supremum比该页的任何主键值都大。如下图所示。


User Record和Free Space

User Record是实际存储行记录的内容。
Free Space是空闲空间,是个链表数据结构。当一条记录被删除后,该空间会被加入到空闲链表中。

Page Directory

数据页的Page Directory用于在页内快速查找某条记录。
分组流程

  1. 初始情况下⼀个数据⻚⾥只有最⼩记录和最⼤记录两条记录,它们分属于两个分组。
  2. 最⼩记录所在的分组只能有1条记录,最⼤记录所在的分组拥有的记录条数只能在1-8条,剩下的分组中记录的条数范围只能在是4-8条之间。
  3. 将每个组的最后⼀条记录的地址偏移量按照从小到大的顺序存储到Page Directory里。Page Directory的这些地址偏移量被称为槽。
  4. 之后每插⼊⼀条记录,都会从⻚⽬录中找到主键值⽐本记录的主键值⼤并且差值最⼩的槽,然后把该槽对应的记录的n_owned值+1,表示本组内⼜添加了⼀条记录,直到该组中的记录数等于8个为止。
  5. 在⼀个组中的记录数等于8个后再插⼊⼀条记录时,会将组中的记录拆分成两个组,⼀个组中4条记录,另⼀个5条记录。这个过程会更新当前组对应的槽,且另外会新增⼀个槽来记录这个新增分组中最⼤的那条记录的偏移量。

示例

  1. 初始情况如下图所示,下图中行记录中属性的含义参见“InnoDB与其它存储引擎--InnoDB的行--COMPACT”。该页有2个组。第1组,也就是Infimum Record所在的组只有1条记录。第2组,也就是Supreme Record所在的组有7条记录。


  2. 插入1条主键值为2的记录:槽1所指的记录的主键值比待插入记录大,且差值最小。将该组的主键最大记录的n_owned +1。也就是将Supreme Record记录的n_owned +1。然后调整next record指针,调整heap no。结果如下图所示。


  3. 插入1条主键值为3的记录。槽1所指的记录的主键值比待插入记录大,且差值最小。此时,槽1对应的组已经有8条记录了。则将该组拆分为2组。更新这2组的heap_no,next_record,槽等信息。进一步简化后的示意图如下所示。


⻚中查找指定主键值的记录流程

  1. 通过⼆分法比较槽所指记录的主键值与待查键值的大小,来确定待查记录所在的槽。
  2. 确定槽后,从槽所指的记录开始,通过记录的next_record属性遍历该槽所在的组中的各个记录,至到找到指定主键的记录,或者遍历完整个组为止。

File Trailer

所有页类型的File Trailer都相同,一共有8个字节,分成2个部分。

前4个字节代表⻚的校验和(checksum),这个部分和FileHeader中FIL_PAGE_SPACE_OR_CHKSUM相对应的。具体通过InnoDB的checksum函数来运算两者,将运算结果进行比较。如果结果相同,才代表页面被完整的刷新到了磁盘。(因为刷盘是先刷File Header,后刷File Trailer)

后4个字节与File Header中的FIL_PAGE_LSN相同,这个部分也是为了校验⻚的完整性的。

结尾

MySQL数据页就讲完了,希望大家能持续关注下去。下一篇MySQL文章讲InnoDB-表空间。
感谢各位人才的点赞、收藏和评论,干货文章持续更新中,下篇文章再见!

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 212,718评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,683评论 3 385
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,207评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,755评论 1 284
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,862评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,050评论 1 291
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,136评论 3 410
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,882评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,330评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,651评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,789评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,477评论 4 333
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,135评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,864评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,099评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,598评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,697评论 2 351

推荐阅读更多精彩内容

  • 不同类型的页简介 前边我们简单提了一下页的概念,它是InnoDB管理存储空间的基本单位,一个页的大小一般是16KB...
    tracy_668阅读 1,149评论 1 6
  • 一、页 1、数据库的存储结构——页 索引结构给我们提供了高效的索引方式,不过索引信息以及数据记录都是保存在文件上的...
    紫荆秋雪_文阅读 253评论 0 0
  • Mysql--InnoDB数据页结构 页 1.页是innodb管理存储空间的基本单位 2.一般大小是16kb 3....
    简书徐小耳阅读 2,459评论 1 1
  • 页是 InnoDB 管理存储空间的基本单位,InnoDB 为了不同的目的设计了不同类型的页,比如,这里我们讨论的是...
    wayyyy阅读 289评论 0 0
  • 前言 最近在学MySQL,决定记录一下,能写多少写多少,不定时更新,加油。 正文 分几个部分来吧,大致如下: 字符...
    sunyelw阅读 8,610评论 4 8