杂文

1. 概述


索引是存储引擎用于快速查找记录的一种数据结构,通过合理的使用数据库索引可以大大提高系统的访问性能,接下来主要介绍在MySql数据库中索引类型,以及如何创建出更加合理且高效的索引技巧。
:这里主要针对的是InnoDB存储引擎的B+Tree索引数据结构


2. 索引的优点


  1. 大大减轻了服务器需要扫描的数据量,从而提高了数据的检索速度
  2. 帮助服务器避免排序和临时表
  3. 可以将随机I/O变为顺序I/O

    3. 索引的创建

    3.1 主键索引

    ALTER TABLE 'table_name' ADD PRIMARY KEY 'index_name' ('column');
    

    3.2 唯一索引

    ALTER TABLE 'table_name' ADD UNIQUE 'index_name' ('column');
    

    3.3 普通索引

    ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column');
    

    3.4 全文索引

    ALTER TABLE 'table_name' ADD FULLTEXT 'index_name' ('column');
    

    3.5 组合索引

    ALTER TABLE 'table_name' ADD INDEX 'index_name' ('column1', 'column2', ...);
    

    4. B+Tree的索引规则

    创建一个测试的用户表
    DROP TABLE IF EXISTS user_test;
    CREATE TABLE user_test(
    id int AUTO_INCREMENT PRIMARY KEY,
    user_name varchar(30) NOT NULL,
    sex bit(1) NOT NULL DEFAULT b'1',
    city varchar(50) NOT NULL,
    age int NOT NULL
    ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
    
    创建一个组合索引: ALTER TABLE user_test ADD INDEX idx_user(user_name , city , age);

    4.1 索引有效的查询

    4.1.1 全值匹配
    全值匹配指的是和索引中的所有列进行匹配,如:以上面创建的索引为例,在where条件后可同时查询(user_name,city,age)为条件的数据。
    注:与where后查询条件的顺序无关,这里是很多同学容易误解的一个地方
    SELECT * FROM user_test WHERE user_name = 'feinik' AND age = 26 AND city = '广州';
    
    4.1.2 匹配最左前缀
    匹配最左前缀是指优先匹配最左索引列,如:上面创建的索引可用于查询条件为:(user_name )、(user_name, city)、(user_name , city , age)
    :满足最左前缀查询条件的顺序与索引列的顺序无关,如:(city, user_name)、(age, city, user_name)
    4.1.3 匹配列前缀
    指匹配列值的开头部分,如:查询用户名以feinik开头的所有用户
    SELECT * FROM user_test WHERE user_name LIKE 'feinik%';
    
    4.1.4 匹配范围值
    如:查询用户名以feinik开头的所有用户,这里使用了索引的第一列
    SELECT * FROM user_test WHERE user_name LIKE 'feinik%';
    

    4.2 索引的限制

    1、where查询条件中不包含索引列中的最左索引列,则无法使用到索引查询,如:
    SELECT * FROM user_test WHERE city = '广州';
    
    SELECT * FROM user_test WHERE age= 26;
    
    SELECT * FROM user_test WHERE city = '广州' AND age = '26';
    
    2、即使where的查询条件是最左索引列,也无法使用索引查询用户名以feinik结尾的用户
    SELECT * FROM user_test WHERE user_name like '%feinik';
    
    3、如果where查询条件中有某个列的范围查询,则其右边的所有列都无法使用索引优化查询,如:
    SELECT * FROM user_test WHERE user_name = 'feinik' AND city LIKE '广州%' AND age = 26;
    

    5. 高效的索引策略

    5.1 索引列不能是表达式的一部分,也不能作为函数的参数,否则无法使用索引查询。

    SELECT * FROM user_test WHERE user_name = concat(user_name, 'fei');
    

    5.2 前缀索引

    有时候需要索引很长的字符列,这会增加索引的存储空间以及降低索引的效率,一种策略是可以使用哈希索引,还有一种就是可以使用前缀索引,前缀索引是选择字符列的前n个字符作为索引,这样可以大大节约索引空间,从而提高索引效率。
    5.2.1 前缀索引的选择性
    前缀索引要选择足够长的前缀以保证高的选择性,同时又不能太长,我们可以通过以下方式来计算出合适的前缀索引的选择长度值:
    (1)
    SELECT COUNT(DISTINCT index_column)/COUNT(*) FROM table_name; -- index_column代表要添加前缀索引的列
    
    :通过以上方式来计算出前缀索引的选择性比值,比值越高说明索引的效率也就越高效。
    (2)
    SELECT
    COUNT(DISTINCT LEFT(index_column,1))/COUNT(*),
    COUNT(DISTINCT LEFT(index_column,2))/COUNT(*),
    COUNT(DISTINCT LEFT(index_column,3))/COUNT(*)
    ...
    FROM table_name;
    
    :通过以上语句逐步找到最接近于(1)中的前缀索引的选择性比值,那么就可以使用对应的字符截取长度来做前缀索引了
    5.2.2 前缀索引的创建
    ALTER TABLE table_name ADD INDEX index_name (index_column(length));
    
    5.2.3 使用前缀索引的注意点
    前缀索引是一种能使索引更小,更快的有效办法,但是MySql无法使用前缀索引做ORDER BY 和 GROUP BY以及使用前缀索引做覆盖扫描。

    5.3 选择合适的索引列顺序

    在组合索引的创建中索引列的顺序非常重要,正确的索引顺序依赖于使用该索引的查询方式,对于组合索引的索引顺序可以通过经验法则来帮助我们完成:将选择性最高的列放到索引最前列,该法则与前缀索引的选择性方法一致,但并不是说所有的组合索引的顺序都使用该法则就能确定,还需要根据具体的查询场景来确定具体的索引顺序。

    5.4 聚集索引与非聚集索引

    1. 聚集索引
    聚集索引决定数据在物理磁盘上的物理排序,一个表只能有一个聚集索引,如果定义了主键,那么InnoDB会通过主键来聚集数据,如果没有定义主键,InnoDB会选择一个唯一的非空索引代替,如果没有唯一的非空索引,InnoDB会隐式定义一个主键来作为聚集索引。
    聚集索引可以很大程度的提高访问速度,因为聚集索引将索引和行数据保存在了同一个B-Tree中,所以找到了索引也就相应的找到了对应的行数据,但在使用聚集索引的时候需注意避免随机的聚集索引(一般指主键值不连续,且分布范围不均匀),如使用UUID来作为聚集索引性能会很差,因为UUID值的不连续会导致增加很多的索引碎片和随机I/O,最终导致查询的性能急剧下降。
    2. 非聚集索引
    与聚集索引不同的是非聚集索引并不决定数据在磁盘上的物理排序,且在B-Tree中包含索引但不包含行数据,行数据只是通过保存在B-Tree中的索引对应的指针来指向行数据,如:上面在(user_name,city, age)上建立的索引就是非聚集索引。

    5.5 覆盖索引

    如果一个索引(如:组合索引)中包含所有要查询的字段的值,那么就称之为覆盖索引,如:
    SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' AND age > 25;
    
    因为要查询的字段(user_name, city, age)都包含在组合索引的索引列中,所以就使用了覆盖索引查询,查看是否使用了覆盖索引可以通过执行计划中的Extra中的值为Using index则证明使用了覆盖索引,覆盖索引可以极大的提高访问性能。

    5.6 如何使用索引来排序

    在排序操作中如果能使用到索引来排序,那么可以极大的提高排序的速度,要使用索引来排序需要满足以下两点即可。


    1. ORDER BY子句后的列顺序要与组合索引的列顺序一致,且所有排序列的排序方向(正序/倒序)需一致
    1. 所查询的字段值需要包含在索引列中,及满足覆盖索引
      通过例子来具体分析
      在user_test表上创建一个组合索引
      ALTER TABLE user_test ADD INDEX index_user(user_name , city , age);
      
      可以使用到索引排序的案例
      1、SELECT user_name, city, age FROM user_test ORDER BY user_name;
      2、SELECT user_name, city, age FROM user_test ORDER BY user_name, city;
      3、SELECT user_name, city, age FROM user_test ORDER BY user_name DESC, city DESC;
      4、SELECT user_name, city, age FROM user_test WHERE user_name = 'feinik' ORDER BY city;
      
      :第4点比较特殊一点,如果where查询条件为索引列的第一列,且为常量条件,那么也可以使用到索引
      无法使用索引排序的案例
      1. sex不在索引列中
      SELECT user_name, city, age FROM user_test ORDER BY user_name, sex;
      
      2. 排序列的方向不一致
      SELECT user_name, city, age FROM user_test ORDER BY user_name ASC, city DESC;
      
      3、所要查询的字段列sex没有包含在索引列中
      SELECT user_name, city, age, sex FROM user_test ORDER BY user_name;
      
      4、where查询条件后的user_name为范围查询,所以无法使用到索引的其他列
      SELECT user_name, city, age FROM user_test WHERE user_name LIKE 'feinik%' ORDER BY city;
      
      5、多表连接查询时,只有当ORDER BY后的排序字段都是第一个表中的索引列(需要满足以上索引排序的两个规则)时,方可使用索引排序。如:再创建一个用户的扩展表user_test_ext,并建立uid的索引。
      DROP TABLE IF EXISTS user_test_ext;
      CREATE TABLE user_test_ext(
      id int AUTO_INCREMENT PRIMARY KEY,
      uid int NOT NULL,
      u_password VARCHAR(64) NOT NULL
      ) ENGINE=InnoDB DEFAULT CHARSET=utf8;
      ALTER TABLE user_test_ext ADD INDEX index_user_ext(uid);
      
      走索引排序
      SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY u.user_name;
      
      不走索引排序
      SELECT user_name, city, age FROM user_test u LEFT JOIN user_test_ext ue ON u.id = ue.uid ORDER BY ue.uid;
      

      6. 总结

      本文主要讲了B+Tree树结构的索引规则,不同索引的创建,以及如何正确的创建出高效的索引技巧来尽可能的提高查询速度,当然了关于索引的使用技巧不单单只有这些,关于索引的更多技巧还需平时不断的积累相关经验。


最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 214,922评论 6 497
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 91,591评论 3 389
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 160,546评论 0 350
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 57,467评论 1 288
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 66,553评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,580评论 1 293
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,588评论 3 414
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,334评论 0 270
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,780评论 1 307
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,092评论 2 330
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,270评论 1 344
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,925评论 5 338
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,573评论 3 322
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,194评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,437评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,154评论 2 366
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,127评论 2 352

推荐阅读更多精彩内容

  • 【注】本文较长,基本上集合了所有症状,建议转电脑上,利用Ctrl+F查看 猫杯状病毒病 猫杯状病毒(FelineC...
    妞妞的铲屎官阅读 45,984评论 5 42
  • 夜晚我坐在被窝里,抱着笔记本电脑码字,儿子则在床边玩耍。我突然感觉有点口渴,又觉得喝水索然无味。看了看玩耍的儿子,...
    Maple718阅读 771评论 2 5
  • 雪萱:你们说小小易今天早上怎么没来? 晓萱:肯定有事啦! 灵萱:做为你们的长辈……我觉得小小易一定是睡过头了。 [...
    我的名字叫青春阅读 182评论 5 1
  • 站在起点看终点,终点太遥远。站在终点看起点,四个字--不过如此。 你愿意从起点开始,说明成功正向你伸手,你走到了终...
    滋心润霖阅读 298评论 0 0