mysql索引探究 btree索引和hash索引

B-tree索引
mysql中btree存储的物理文件大多是balance tree(平衡树)结构来存储的。也就是实际存储数据放在叶节点。而且任何一个叶节点的最短路径都一样。可能各种数据库的在存放自己的btree索引时会对存储结构做改动。例如:innodo的btree实际上是b+tree,在原有的叶节点除了存放索引等关键信息外,还存储了后一个叶节点的指针信息。这是出于加快检索多个相邻的叶节点的效率考虑的。
主键索引 :
叶节点存放的,除了主键的数据外,还有其他字段数据的以主键的有序排列。所以,通过主键来访问数据效率是非常高的。
btree索引:
不仅在叶节点存放索引的相关信息,也有主键值。
通过secondary index访问,通过相应的索引检索到leaf node,再通过leaf node中存放的主键信息来获取数据行。

Image.png

MyISAM的索引形式是b+tree,leaf node存放的是数据记录地址。可以看的出来,myisam的索引文件仅仅保存数据记录的地址
MyISAM索引文件和数据文件是分离的
它的主索引和辅助索引在结构上没有区别,只是主索引要求唯一,而辅助索引可以重复。
MyISAM的索引方式也叫做“非聚集”的,之所以这么称呼是为了与InnoDB的聚集索引区分。
MyISAM中首先按照b+tree搜索算法搜索索引,如果指定的key存在,则去除data域,再通过data域的值为地址去读取相应的数据记录。

Image.png

InnoDB的数据文件本身就是索引文件。
InnoDB中,表数据文件本身就是按B+Tree组织的一个索引结构,这棵树的叶节点data域保存了完整的数据记录。这个索引的key是数据表的主键,因此InnoDB表数据文件本身就是主索引。
这种索引叫做聚集索引。
因为InnoDB的数据文件本身要按主键聚集,所以InnoDB要求表必须有主键(MyISAM可以没有),如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键
所以,innodb检索直接通过主键非常地高效。

与MyISAM索引的不同是InnoDB的辅助索引data域存储相应记录主键的值而不是地址。换句话说:innodb的辅助索引会引用主键作为自己的data域。
聚集索引这种实现方式使得按主键的搜索十分高效。

innodb的主键不宜过长,以为辅助索引会引用主索引。过长的主索引会导致辅助索引变大。
根据b+tree的特性,自增字段可以做到和b+tree的leaf node分裂顺序一致。所以用自增字段做innodb的主键是一个很好的选择

Image.png

标准的B+tree
一个平衡的多叉树,根节点到各叶节点的高度差不超过1,同层级节点之间有指针相互衔接。
这种数据结构,从根节点到叶节点的检索效率相当,基于索引的顺序扫描,也可以利用双向指针快速顺序移动。效率很高。
所以,B+树索引被广泛应用于数据库、文件系统等场景。
顺便说一下,xfs文件系统比ext3/ext4效率高很多的原因之一就是,它的文件及目录索引结构全部采用B+树索引,而ext3/ext4的文件目录结构则采用Linked list, hashed B-tree、Extents/Bitmap等索引数据结构,因此在高I/O压力下,其IOPS能力不如xfs。

Image.png

哈希索引就是把键值通过hash算法,转化为hash值,检索不需要像btree那样从根节点到叶节点这样逐级查找。只需要一次hash算法就可定位。
Hash索引
hash索引的检索效率高于btree,因为它是一次到位,不像btree要从根节点到枝节点,再到页节点多次的IO访问。
但是hash 也有很多弊端:
1.仅仅能满足 "=","IN"和"<=>",它不能使用范围查询。
因为他是通过比较hash值,原先是有序的键值,经过hash有可能变得不连续了,so只能用于等值过滤。

2.同理,无法进行数据的排序操作,以及 like ‘xxx%’这样的模糊查询(模糊查询,本质上还是范围查询)

3.不能利用部分索引查询
因为它是计算组合索引合并后的hash值,而不是单独计算。对于一个或者多个的组合索引进行查询的时候,hash索引无法被利用。

4在任何时候都不能避免扫描全表
由于不同的hash索引存在相同的hash值,所以即使满足某个hash值的记录条数,也无法直接在hash索引中完成查询。还是要通过表中的数据进行实际的比较。

5.在遇到大量的重复键,就是hash值相等的情况下,性能不一定比btree高。
因为存在hash冲撞。

在MySQL中,只有HEAP/MEMORY引擎表才能显式支持哈希索引(NDB也支持,但这个不常用),
InnoDB引擎的自适应哈希索引(adaptive hash index)不在此列,因为这不是创建索引时可指定的。
还需要注意到:HEAP/MEMORY引擎表在mysql实例重启后,数据会丢失。

适合用hash索引
SELECT … FROM t WHERE C1 = ?; — 仅等值查询
大多数情况下,都会有范围查询,模糊查询这些,用btree索引就行。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 220,137评论 6 511
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 93,824评论 3 396
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 166,465评论 0 357
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 59,131评论 1 295
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 68,140评论 6 397
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,895评论 1 308
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,535评论 3 420
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,435评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,952评论 1 319
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 38,081评论 3 340
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 40,210评论 1 352
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,896评论 5 347
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,552评论 3 331
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 32,089评论 0 23
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 33,198评论 1 272
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,531评论 3 375
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 45,209评论 2 357

推荐阅读更多精彩内容