MySQL索引使用细节

MySQL索引使用细节

这里不介绍MySQL索引是什么,仅总结索引使用的一些注意事项

索引的代价

我们知道了B+树的索引原理之后,也知道了表中的数据都是在聚簇索引上的,同时就是一颗B+树。所有之后按其他建立的索引都是二级索引也叫非聚簇索引

奇迹和魔法可不是免费的

额外的索引当然是有代价的,就像正常插入数据到聚簇索引中需要调整B+树一样,二级索引也有一模一样的维护代价。那么毫无疑问多余的索引存在:

  • 空间代价

    B+树的一个节点在内存中体现为一个,一页的大小是16KB,如果索引很多,内存中就会有更多的索引页。

  • 时间代价

    如果一个表频繁的被修改,那么每次操作都要同步去修改B+树中的索引值,索引越多需要同时维护的B+树就越多,这显然是一笔不小的代价

所以索引的建立不是越多越好,索引的选择和使用更像是不断权衡比较选择相对最优的选择。

索引的匹配规则

简单说明索引是如何创建的:当以多个值建立联合索引时,会按从左到右的顺序进行排序,也就是假如建立的索引为(A, B, C)

那么会先按列A进行排序,直到A值完全一样,再依照B进行排序,C同理。

索引这种规则也就解释了最左前缀原则,当希望使用索引时,应该包含索引从左开始的连续字段,因为查询的顺序也就是按建立索引的顺序来的。

提供几个样例来说明:

  1. 字符串的模糊查询是可以使用索引的(如果建立了的话),因为以name排序的过程中,实际是字符串的比较排序,而字符串的比较是从左到右一个个字符比较大小的来,这和建立联合索引的规则类似,比较好理解。
SELECT * FROM person_info WHERE name LIKE 'As%';
  1. 条件查询中and连接的条件顺序不影响索引的使用,SQL语句执行前有查询优化器。
SELECT * FROM person_info WHERE B = '1' and C = '2' and A = '0';

范围值的匹配

如下的例子是可以使用索引的。

SELECT * FROM person_info WHERE name > 'Asa' AND name < 'Barlow';

name排序之后,对范围内的查询相当于分别查找两个边界值,再去节点之间的链表值

不要忘记了B+树的叶子节点是链表构成的,有了边界节点,在链表中遍历就能找到期望数据了。

注意!

范围查询可以使用索引是有要求的,简单总结成一句话就是,范围查询的左边都是精确查询,而范围查询的右边无法使用索引。解释一下:

联合索引是从左向右依次排序的,也就是只有在当前比较列之前的完全相同的情况下,索引才是有效的。而左边全是精确查询就确保了 在范围查询前之前的列值是完全一样的,就可以通过索引查找范围,而找到一个范围值之后剩下查询的值就不能通过索引保证排序的(当前在一个链表中假设按A进行排序,而之后的B,C在单独的一个A值下才是有序的,在这个列表中则表现为无序)。

范围查找的索引状况.png

关于关键字

  • Order By之后的顺序遵循最左前缀原则,同时如果要使用索引,顺序必须一致,order by就是一个按提供键 顺序排序的过程。

    同时注意不要ASC,DESC混合使用。这样也会导致索引效率低下

  • WHERE中最好只有建立了索引的列,如果出现了未建立索引的列,那么查询只能先将符合条件的记录提取出来之后再进行排序。

    同样的,WHERE条件中对索引列不要使用表达式函数,这会导致查询将先对表达式进行计算,构建成新的列再排序。

  • Group by这点和Order By是完全类似的。

关于回表

回表同样也是建立使用索引必须要权衡的代价之一。考虑这样一个查询

SELECT * FROM person_info WHERE name > 'Asa' AND name < 'Barlow';

在范围查找之后,要选择出全部的数据,那么就必然需要拿着索引中找到的主键去回表。

  • 访问二级索引使用顺序I/O,访问聚簇索引使用随机I/O

需要回表的记录越多,使用二级索引的性能就越差。甚至可能因为回表过多,MySQL会将索引优化成全表扫描。所以使用索引时尽可能指定需要的数据,而不要使用来表示,同时尽可能选择索引中包含的列值*,这样就不会进行回表。

覆盖索引是一种解决回表的方式,但代价是存储了相当的冗余数据。

挑选索引

只列出几条大致的规则:

  • 只为用于搜索,排序,和分组的列创建索引

  • 考虑列的基数

    列的基数指某一列中不重复数据的个数。如果一个列中重复的数据过多,基数过小(例如性别数据只有男,女,基数为2)那么建立索引的效果就特别差,因为在节点中查找时几乎没有区分数据的功能

  • 索引列的类型尽量小

    这是考虑到建立,维护索引的代价。以整数类型为例,有TINYINTMEDIUMINTINTBIGINT这么几种,它们占用的存储空间依次递增,我们这里所说的类型大小指的就是该类型表示的数据范围的大小。能表示的整数范围当然也是依次递增,如果我们想要对某个整数列建立索引的话,在表示的整数范围允许的情况下,尽量让索引列使用较小的类型,比如我们能使用INT就不要使用BIGINT,能使用MEDIUMINT就不要使用INT

    • 数据类型越小,查询时比较操作越快

    • 数据类型越小,索引所占空间更小,一个页面中可以存放更多的索引数据,变相减少了磁盘的I/O次数

  • 使用字符串值的前缀

    这点是针对字符串可能过长的情况,理由和上面类似,为了减少查询和维护时的代价,仅以字符串前几位进行比较建立索引。之后的值可以在一个小范围内遍历查找,这样牺牲了极小的性能省出了更多的空间和查找时间。

主键的选取

关于主键的选择,一般MySQL会使用标记为Unique的列构建索引,如果没有则会创建一个隐藏的自增列用于排序(在行格式,列结构中提到过)。对于大多数情况来说,主键最好选择一个非业务的列,因为自增的值是便于在中插入行数据的,如果不是顺序的键很有可能数据插入过程中被分配在不同的,而插入新值后又需要不断调整行数据的位置导致页分裂之类的问题,影响效率。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 217,657评论 6 505
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,889评论 3 394
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 164,057评论 0 354
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,509评论 1 293
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,562评论 6 392
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,443评论 1 302
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,251评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 39,129评论 0 276
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,561评论 1 314
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,779评论 3 335
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,902评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,621评论 5 345
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,220评论 3 328
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,838评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,971评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 48,025评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,843评论 2 354

推荐阅读更多精彩内容

  • 索引 数据库中的查询操作非常普遍,索引就是提升查找速度的一种手段 索引的类型 从数据结构角度分 1.B+索引:传统...
    一凡呀阅读 2,919评论 0 8
  • 马上就要到国庆节了,好是期待呀。最近一直忙成狗,急需一个长假调整一下自己的心境和状态 今天我们要说的是索引相关的知...
    小炼君阅读 950评论 0 50
  • 说到索引,很多人都知道“索引是一个排序的列表,在这个列表中存储着索引的值和包含这个值的数据所在行的物理地址,在数据...
    爱情小傻蛋阅读 684评论 2 2
  • 创建高性能索引 索引是什么?有什么作用? 索引是存储引擎用于快速找到记录的一种数据结构 如书的目录索引一般,数据库...
    esrever阅读 656评论 0 0
  • 适合人群:产品经理小白,想跨入产品经理行业的人。 本书简介:作者胡澈,是腾讯产品经理。全书分为五部分,分别为:什么...
    Lady韩小茹阅读 508评论 1 4