11.order by 的工作原理2022-02-22

建表语句

CREATE TABLE `t` (
  `id` int(11) NOT NULL,
  `city` varchar(16) NOT NULL,
  `name` varchar(16) NOT NULL,
  `age` int(11) NOT NULL,
  `addr` varchar(128) DEFAULT NULL,
  PRIMARY KEY (`id`),
  KEY `city` (`city`)
) ENGINE=InnoDB;

执行sql

select city,name,age from t where city='杭州' order by name limit 1000  ;

一、全字段排序的原理

用explain sql语句会得到下图


分析sql图

图中的Extra中的 Using filesort表示需要排序,MySQL会给每个线程分配一块内存用作排序叫做sort_buffer

1.上述排序sql在用全字段排序的流程

(1)初始化sort_buffer,确定可以放入city、name、age三个字段;
(2)根据索引city,找到第一个city=‘杭州’的主键id;
(3)根据主键id找到该行数据,返回city、name、age到sort_buffer中;
(4)依次寻找下一个主键id;
(5)循环执行步骤3、4,直到city != '杭州'为止;
(6)把sort_buffer的数据根据name做快速排序;
(7)按照结果返回1000行给客户端;

2.在MySQL中根据字段排序是在哪里进行的?

排序既可能只在内存中进行,也可能内存和磁盘同时进行;

在哪里进行是由什么决定的?
sort_buffer_size:排序时MySQL开辟的内存大小;
如果sort_buffer_size大于需要排序参数的内存,就只在内存排序;反之,就既在内存排序,也会用磁盘空间辅助进行;

怎么看MySQL是否使用了磁盘空间辅助排序呢?

  /* 打开optimizer_trace,只对本线程有效 */
  SET optimizer_trace='enabled=on'; 

  /* @a保存Innodb_rows_read的初始值 */
  select VARIABLE_VALUE into @a from  performance_schema.session_status where variable_name =   'Innodb_rows_read';

  /* 执行语句 */
  select city, name,age from t where city='杭州' order by name limit 1000; 

/* 查看 OPTIMIZER_TRACE 输出 */
SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G

/* @b保存Innodb_rows_read的当前值 */
select VARIABLE_VALUE into @b from performance_schema.session_status where variable_name = 'Innodb_rows_read';

/* 计算Innodb_rows_read差值 */
select @b-@a;

在查看OPTIMIZER_TRACE这步可以看出下图:

OPTIMIZER_TRACE.png

number_of_tmp_files表示什么意思?
理解为什么是12,因为外部排序一般会使用归并排序的算法,MySQL把需要排序的数据分成12份,把每份单独排序后存入磁盘的12个文件,最后合并成一个文件返回给客户端。
如果number_of_tmp_files的值为0,则表示排序只在内存进行。

examined_rows=4000表示什么意思?
examined_rows=4000,表示参与排序的行数是 4000 行

sort_mode 里面的 packed_additional_fields 的意思是?
说明排序的过程中对字符串做了紧凑处理;按字符串的实际长度来分配空间。

select @b-@a 的返回结果是 4000表示什么?
表示整个执行过程扫描的行数

怎么把internal_tmp_disk_storage_engine 设置成 MyISAM?
internal_tmp_disk_storage_engine 这个参数是用来空值MySQL内部在创建临时表的时候,使用的默认存储引擎是什么,这个参数可以配置为MyISAM或者InnoDB两个。 5.7之后,默认的参数为InnoDB。

为什么InnoDB引擎select @b-@a 的返回结果是 4001?

因为查询 OPTIMIZER_TRACE 这个表时,需要用到临时表,而 internal_tmp_disk_storage_engine 的默认值是 InnoDB。如果使用的是 InnoDB 引擎的话,把数据从临时表取出来的时候,会让 Innodb_rows_read 的值加 1。

二、rowid排序

rowid排序会限制排序时单条数数据字段的总长度:例如

 SET max_length_for_sort_data = 16;

意思就是如果返回的单条字段长度大于16,那么只会返回需要排序的字段和主键;以上例子中只会返回name、id;

1.rowid排序的执行流程和全字段排序流程有什么区别?

rowid排序的流程比全字段排序,在数据库取字段的时候只取name、id;在排完序后,还会再到表里根据主键再查一次,最终把结果返回给客户端。

2.为什么select @b-@a 这个语句的值变成 5000 了?

因为rowid排序比全字段排序多了回表里查询的过程。由于limit是1000,所以多了1000。

3.sort_mode 变成了 <sort_key, rowid>?

因为只用了这两个字段。

4.number_of_tmp_files 变成 10 了?

因为需要进行排序的字段小了,所需要分配的空间也变小了。

三、全字段排序和rowid排序的比较?

MySQL的原则是能尽量使用内存排序就不要用磁盘。如果实在是觉得内存不够用了才会用rowid排序,因为rowid排序会有增加的读盘操作,所以不推荐使用。

四、优化方案

1.优化方案1,使用city、name的联合索引

使用该方案的时候,只需要查找到满足city='杭州'的记录即可,不需要进行排序,最后再用主键进行查找<=1000条的记录即可。


引入 (city,name) 联合索引后,查询语句的执行计划

Extra 字段中没有 Using filesort 了,也就是不需要排序了

2.进一步优化方案,使用city、name、age的联合索引

这个时候用到了覆盖索引的优化方案,覆盖索引的概念是索引就已经满足查询,不需要在回到主键索引去取数据。


引入 (city,name,age) 联合索引后,查询语句的执行计划

Extra 字段里面多了“Using index”,表示的就是使用了覆盖索引

五、思考题

假设你的表里面已经有了 city_name(city, name) 这个联合索引,然后你要查杭州和苏州两个城市中所有的市民的姓名,并且按名字排序,显示前 100 条记录。如果 SQL 查询语句是这么写的 :

    mysql> select * from t where city in ('杭州',"苏州") order by name limit 100;

那么,这个语句执行的时候会有排序过程吗,为什么?如果业务端代码由你来开发,需要实现一个在数据库端不需要排序的方案,你会怎么实现呢?进一步地,如果有分页需求,要显示第 101 页,也就是说语句最后要改成 “limit 10000,100”, 你的实现方法又会是什么呢?

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,997评论 6 502
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,603评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 163,359评论 0 353
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,309评论 1 292
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,346评论 6 390
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,258评论 1 300
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 40,122评论 3 418
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,970评论 0 275
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,403评论 1 313
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,596评论 3 334
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,769评论 1 348
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,464评论 5 344
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 41,075评论 3 327
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,705评论 0 22
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,848评论 1 269
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,831评论 2 370
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,678评论 2 354

推荐阅读更多精彩内容