Mysql--InnoDB数据页结构

Mysql--InnoDB数据页结构

  • 1.页是innodb管理存储空间的基本单位
  • 2.一般大小是16kb
  • 3.不同的页存储不同的数据类型,比如存放表空间头部信息的页,存放insertBuffer信息的页面,存放INODE的页,存放undo日志信息或者索引页(数据页)

数据页(索引页)

数据页结构如下

  • 1.File Header:文件头部,页的一些通用信息
  • 2.page Header:页面头部,数据页专有的一些信息
  • 3.infimum+supremum:行记录最小值和最大值,两个虚拟的行记录
  • 4.user recorders:实际存储的行记录内容
  • 5.free space:页中尚未使用的空间
  • 6.Page Directory:页中的某些记录的相对位置
  • 7.File Tailer:校验页是否完整

记录在页中的存储

  • 1.当一个记录需要插入页的时候,会从free space划分空间到user recorders
  • 2.Free Space部分的空间全部被User Records部分替代掉之后,也就意味着这个页使用完了,如果还有新的记录插入的话,就需要去申请新的页了。

记录头信息的秘密

  • 1.预留位1 没有使用
  • 2.预留位2 没有使用
  • 3.delete_mask 标记该记录是否被删除
  • 4.min_rec_mask B+树的每层非叶子节点中的最小记录都会添加该标记--``
  • 5.n_owned 表示当前记录拥有的记录数,一般是每个页中的每个槽中最大值标识这个槽有几个记录。
  • 6.heap_no 表示当前记录在记录堆的位置信息
  • 7.record_type 表示当前记录的类型,0表示普通记录,1表示B+树非叶节点记录,2表示最小记录,3表示最大记录
  • 8.next_record 表示下一条记录的相对位置

delete_mask

  • 1.这个属性标记着当前记录是否被删除,占用1个二进制位,值为0的时候代表记录并没有被删除,为1的时候代表记录被删除掉了
  • 2.被删除的记录还在页中,所有被删除掉的记录都会组成一个所谓的垃圾链表---可重用空间
  • 3.如果有新记录插入到表中的话,可能把这些被删除的记录占用的存储空间覆盖掉。
  • 4.将这个delete_mask位设置为1和将被删除的记录加入到垃圾链表中其实是两个阶段

min_rec_mask

  • 1.B+树的每层非叶子节点中的最小记录都会添加该标记(即目录页)
  • 2.如果不是非叶子节点的最小记录则值为0,是的话就是1。

n_owned

  • 1.一个数据页被分为多个组
  • 2.每个组中的最后一条记录的n_owned标记该组有多少个记录
  • 3.其他的记录该属性为0

heap_no

  • 1.某页中的记录在该页中的位置
  • 2.用户记录从2开始,0和1给最大和最小的2个虚拟记录。
  • 3.记录大小的比较是比较主键的大小

伪记录的组成

  • 1.记录头信息和固定的字节
  • 2.字节代表的意思是,最小记录就是inifimum,最大记录就是supremum

record_type

  • 1.这个属性表示当前记录的类型
  • 2.0表示普通记录,1表示B+树非叶节点记录,2表示最小记录,3表示最大记录

next_record

  • 1.从当前记录的真实数据到下一条记录的真实数据的地址偏移量
  • 2.第一条记录的next_record值为32,意味着从第一条记录的真实数据的地址处向后找32个字节便是下一条记录的真实数据
  • 3.下一条记录指得并不是按照我们插入顺序的下一条记录,而是按照主键值由小到大的顺序的下一条记录
  • 4.Infimum记录(也就是最小记录) 的下一条记录就是本页中主键值最小的用户记录
  • 5.而本页中主键值最大的用户记录的下一条记录就是 Supremum记录(也就是最大记录)
  • 6.最大记录的next_record的值为0,这也就是说最大记录是没有下一条记录
  • 7.当数据页中存在多条被删除掉的记录时,这些记录的next_record属性将会把这些被删除掉的记录组成一个垃圾链表,以备之后重用这部分存储空间。

Page Directory(页目录)

页目录简单介绍

  • 1.将所有正常的记录(包括最大和最小记录,不包括标记为已删除的记录)划分为几个组。
  • 2.每个组的最后一条记录(也就是组内最大的那条记录)的头信息中的n_owned属性表示该记录拥有多少条记录,也就是该组内共有几条记录。
  • 3.将每个组的最后一条记录的地址偏移量单独提取出来按顺序存储到靠近页的尾部的地方,这个地方就是所谓的Page Directory
  • 4.页面目录中的这些地址偏移量被称为槽(英文名:Slot),所以这个页面目录就是由槽组成的。
  • 5.一组对应一个槽
  • 6.对于最小记录所在的分组只能有 1 条记录
  • 7.最大记录所在的分组拥有的记录条数只能在 1~8 条之间
  • 8.剩下的分组中记录的条数范围只能在是 4~8 条之间

页目录中涉及到的分组

  • 1.初始情况下一个数据页里只有最小记录和最大记录两条记录,它们分属于两个分组。
  • 2.之后每插入一条记录,都会从页目录中找到主键值比本记录的主键值大并且差值最小的槽,然后把该槽对应的记录的n_owned值加1,表示本组内又添加了一条记录,直到该组中的记录数等于8个
  • 3.在一个组中的记录数等于8个后再插入一条记录时,会将组中的记录拆分成两个组,一个组中4条记录,另一个5条记录。这个过程会在页目录中新增一个槽来记录这个新增分组中最大的那条记录的偏移量。

数据页中查找指定主键值的记录的过程分为两步

  • 1.通过二分法确定该记录所在的槽,并找到该槽中主键值最小的那条记录。
  • 2.通过记录的next_record属性遍历该槽所在的组中的各个记录。

Page Header(页面头部)

  • 1.记录该页包含多少条记录(包括最小和最大记录以及标记为删除的记录)
  • 2.记录第一条记录的地址(是该页第一条记录)
  • 3.页目录中存储了多少个slot
  • 4.还未使用的空间最小地址,也就是说从该地址之后就是Free Space(比如给了99这个地址,则该页尾部到99都是空闲地址)
  • 5.第一个已经标记为删除的记录地址(各个已删除的记录通过next_record也会组成一个单链表,这个单链表中的记录可以被重新利用)
  • 6.已删除记录占用的字节数
  • 7.最后插入记录的位置
  • 8.最后一条记录插入的方向(PAGE_DIRECTION)
  • 9.一个方向连续插入的记录数量(PAGE_N_DIRECTION)
  • 10.该页中记录的数量(不包括最小和最大记录以及被标记为删除的记录)
  • 11.修改当前页的最大事务ID,该值仅在二级索引中定义
  • 12.当前页在B+树中所处的层级
  • 13.索引ID,表示当前页属于哪个索引
  • 14.B+树叶子段的头部信息,仅在B+树的Root页定义
  • 15.B+树非叶子段的头部信息,仅在B+树的Root页定义

方向是指什么意思

  • 假如新插入的一条记录的主键值比上一条记录的主键值大,我们说这条记录的插入方向是右边,反之则是左边

PAGE_N_DIRECTION注意点

  • 假设连续几次插入新记录的方向都是一致的,InnoDB会把沿着同一个方向插入记录的条数记下来,这个条数就用PAGE_N_DIRECTION这个状态表示。当然,如果最后一条记录的插入方向改变了的话,这个状态的值会被清零重新统计

File Header(文件头部)

  • 1.Page Header是专门针对数据页记录的各种状态信息,而File Header则是对所有类型的数据页都适用。
  • 2.页的校验和(checksum值)
  • 3.页号
  • 4.上一个页的页号
  • 5.下一个页的页号
  • 6.页面被最后修改时对应的日志序列位置(英文名是:Log Sequence Number)
  • 7.该页的类型
  • 8.仅在系统表空间的一个页中定义,代表文件至少被刷新到了对应的LSN值
  • 9.页属于哪个表空间

File Trailer

  • 1.为了检测一个页是否完整(也就是在同步的时候有没有发生只同步一半的尴尬情况)
  • 2.前4个字节代表页的校验和
  • 3.后4个字节代表页面被最后修改时对应的日志序列位置(LSN)
  • 4.File Trailer与File Header类似,都是所有类型的页通用的。

前4个字节代表页的校验和

  • 1.每当一个页面在内存中修改了,在同步之前就要把它的校验和算出来
  • 2.因为File Header在页面的前边,所以校验和会被首先同步到磁盘,当完全写完时校验和也会被写到页的尾部
  • 3.如果完全同步成功,则页的首部和尾部的校验和应该是一致的
  • 4.如果写了一半儿断电了,那么在File Header中的校验和就代表着已经修改过的页,而在File Trialer中的校验和代表着原先的页,二者不同则意味着同步中间出了错。

各个数据页可以组成一个双向链表,而每个数据页中的记录会按照主键值从小到大的顺序组成一个单向链表,每个数据页都会为存储在它里边儿的记录生成一个页目录,在通过主键查找某条记录的时候可以在页目录中使用二分法快速定位到对应的槽,然后再遍历该槽对应分组中的记录即可快速找到指定的记录

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,456评论 5 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,370评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,337评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,583评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,596评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,572评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,936评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,595评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,850评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,601评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,685评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,371评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,951评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,934评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,167评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,636评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,411评论 2 342