详解MySQL之SQL优化(1)

MySQL学习笔记(6)

SQL优化(1)

优化SQL的一般步骤

本文所涉及案例表来自MySQL的案例库sakila(官方提供的模拟电影出租厅信息管理系统的数据库),点击下载,压缩包包含sakila-schema.sql、sakila-data.sql和sakila.mwb分别为表结构,数据和MySQL Workbench模型。

通过show status了解SQL执行频率

查看服务器状态信息:show [session|global] status

session 代表当前连接,global为自数据库上次启动至今统计结果。

显示当前session中所有统计参数的值:

show status like 'Com_%';

+-----------------------------+-------+
| Variable_name               | Value |
+-----------------------------+-------+
| Com_admin_commands          | 0     |
| Com_assign_to_keycache      | 0     |
| Com_alter_db                | 0     |
| Com_alter_db_upgrade        | 0     |
| Com_alter_event             | 0     |
| Com_alter_function          | 0     |
| Com_alter_instance          | 0     |
| Com_alter_procedure         | 0     |
| Com_alter_server            | 0     |
| Com_alter_table             | 2     |

Com_xxx表示每个xxx语句执行次数,常关心:Com_select/insert/update/delete,以上对所有存储引擎的表都会累计。针对Innodb引擎,累加算法略有不同,分别为:Innodb_rows_read/inserted/updated/deleted。通过这些参数可以了解当前数据库是以插入更新为主还是查询操作为主,以及各类SQL执行比例。对于事务型应用,可通过Com_commit和Com_rollback了解事务提交和回滚的情况。

以下参数便于用户了解数据库基本情况:

  • Connections:试图连接MySQL服务器的次数
  • Uptime:服务器工作时间
  • Slow_queries:慢查询次数

定位执行效率低的SQL语句

  • 通过慢查询日志定位执行效率低的SQL语句,用--log-slow-queries[=file_name]选项启动时,超过long_query_time的语句会记录在文件中。
  • show processlist查看当前MySQL在进行的线程,查看线程状态、是否锁表等执行情况,同时会对一些锁表操作进行优化。

通过EXPLAIN分析SQL的执行计划

找到效率低的SQL后,可通过EXPLAIN或者DESC命令获取MySQL如何执行SELECT语句的信息,如执行查询过程中表如何连接和连接顺序等,如:

mysql> desc select sum(amount) from customer a,payment b where 1=1 and a.customer_id=b.customer_id and email='JANE.BENNETT@sakilacustomer.org'\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: a
   partitions: NULL
         type: ALL
possible_keys: PRIMARY
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 599
     filtered: 10.00
        Extra: Using where
*************************** 2. row ***************************
           id: 1
  select_type: SIMPLE
        table: b
   partitions: NULL
         type: ref
possible_keys: idx_fk_customer_id
          key: idx_fk_customer_id
      key_len: 2
          ref: sakila.a.customer_id
         rows: 26
     filtered: 100.00
        Extra: NULL
2 rows in set, 1 warning (0.01 sec)
  • select_type:select的类型,常见有SIMPLE(简单表)、PRIMARY(主查询)、UNION、SUBQUERY(子查询中的第一个SELECT)等。
  • table:输出结果集的表
  • type:在表中找到所需行的方式,也叫访问类型。性能为:ALL(全表)<idnex(全索引)<range(索引范围扫描)<ref(非唯一索引或者唯一索引前缀)<eq_ref(唯一索引)<const,system(单表中最多只有一个匹配行)<NULL(不需访问表或索引)
    mysql> explain select * from (select * from customer where email='AARON.SELBY@sakilacustomer.org')a\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: customer
   partitions: NULL
         type: const
possible_keys: uk_email
          key: uk_email
      key_len: 153
          ref: const
         rows: 1
     filtered: 100.00
        Extra: NULL
1 row in set, 1 warning (0.01 sec)

  • possible_keys:可能使用的索引
  • key:实际使用的索引
  • key_len:使用到索引字段的长度
  • rows:扫描行的数量
  • Extra:执行情况的说明

MySQL4.1引入了explain extended,配合show warnings可以看到SQL真正被执行之前优化器做了哪些SQL改写。

MySQL5.1支持分区后,explain也对分区增加了支持,通过explain partition可查看SQL所访问的分区。

通过explain还不能定位SQL问题,此时可以选择profile的联合分析

通过show profile分析SQL

MySQL从5.0.37增加对show profilesshow profile的支持,通过have_profiling参数可查看是否支持profile。默认profiling是关闭的,可通过set在Session级别开启:

mysql> select @@have_profiling;
+------------------+
| @@have_profiling |
+------------------+
| YES              |
+------------------+
1 row in set, 1 warning (0.00 sec)

mysql> select @@profiling;
+-------------+
| @@profiling |
+-------------+
|           0 |
+-------------+
1 row in set, 1 warning (0.00 sec)

mysql> set profiling=1;
Query OK, 0 rows affected, 1 warning (0.00 sec)

通过profile可以更清楚了解SQL执行过程。通过show profile for query id可查看执行过程中线程的每个状态和耗时:

mysql> show profiles;
+----------+------------+-------------------------------+
| Query_ID | Duration   | Query                         |
+----------+------------+-------------------------------+
|        1 | 0.00013100 | SELECT DATABASE()             |
|        2 | 0.00013600 | SELECT DATABASE()             |
|        3 | 0.00040900 | show databases                |
|        4 | 0.00043100 | show tables                   |
|        5 | 0.00039900 | select count(*) from customer |
+----------+------------+-------------------------------+
5 rows in set, 1 warning (0.00 sec)

mysql> show profile for query 5;
+----------------------+----------+
| Status               | Duration |
+----------------------+----------+
| starting             | 0.000073 |
| checking permissions | 0.000009 |
| Opening tables       | 0.000020 |
| init                 | 0.000017 |
| System lock          | 0.000009 |
| optimizing           | 0.000192 |
| executing            | 0.000011 |
| end                  | 0.000007 |
| query end            | 0.000012 |
| closing tables       | 0.000010 |
| freeing items        | 0.000020 |
| cleaning up          | 0.000019 |
+----------------------+----------+
12 rows in set, 1 warning (0.00 sec)

MySQL支持进一步选择all、cpu、block io、context、switch、page faults等明细类型查看MySQL在使用什么资源上耗费过高时间:

mysql> show profile cpu for query 5;
+----------------------+----------+----------+------------+
| Status               | Duration | CPU_user | CPU_system |
+----------------------+----------+----------+------------+
| starting             | 0.000073 | 0.000067 |   0.000006 |
| checking permissions | 0.000009 | 0.000006 |   0.000003 |
| Opening tables       | 0.000020 | 0.000018 |   0.000001 |
| init                 | 0.000017 | 0.000016 |   0.000002 |
| System lock          | 0.000009 | 0.000008 |   0.000001 |
| optimizing           | 0.000192 | 0.000191 |   0.000002 |
| executing            | 0.000011 | 0.000008 |   0.000002 |
| end                  | 0.000007 | 0.000005 |   0.000001 |
| query end            | 0.000012 | 0.000012 |   0.000002 |
| closing tables       | 0.000010 | 0.000008 |   0.000001 |
| freeing items        | 0.000020 | 0.000008 |   0.000011 |
| cleaning up          | 0.000019 | 0.000018 |   0.000002 |
+----------------------+----------+----------+------------+
12 rows in set, 1 warning (0.00 sec)

还可通过source查看SQL解析过程中每步源码:

mysql> show profile source for query 5;
+----------------------+----------+-----------------------+----------------------+-------------+
| Status               | Duration | Source_function       | Source_file          | Source_line |
+----------------------+----------+-----------------------+----------------------+-------------+
| starting             | 0.000073 | NULL                  | NULL                 |        NULL |
| checking permissions | 0.000009 | check_access          | sql_authorization.cc |         835 |
| Opening tables       | 0.000020 | open_tables           | sql_base.cc          |        5649 |
| init                 | 0.000017 | handle_query          | sql_select.cc        |         121 |
| System lock          | 0.000009 | mysql_lock_tables     | lock.cc              |         323 |
| optimizing           | 0.000192 | optimize              | sql_optimizer.cc     |         151 |
| executing            | 0.000011 | exec                  | sql_executor.cc      |         119 |
| end                  | 0.000007 | handle_query          | sql_select.cc        |         199 |
| query end            | 0.000012 | mysql_execute_command | sql_parse.cc         |        5004 |
| closing tables       | 0.000010 | mysql_execute_command | sql_parse.cc         |        5056 |
| freeing items        | 0.000020 | mysql_parse           | sql_parse.cc         |        5630 |
| cleaning up          | 0.000019 | dispatch_command      | sql_parse.cc         |        1901 |
+----------------------+----------+-----------------------+----------------------+-------------+

通过trace分析优化器如何选择执行计划

MySQL5.6提供了对SQL跟踪trace,通过trace可了解优化器为何选择优化器A而不是B。使用方式:首先打开trace,格式为JSON,设置最大使用内存,避免不够不能完整显示解析过程;然后执行想做trace的SQL,最后检查INFORMATION_SCHEMA.OPTIMIZER_TRACE即可。

mysql> select @@optimizer_trace;
+-------------------------+
| @@optimizer_trace       |
+-------------------------+
| enabled=on,one_line=off |
+-------------------------+
1 row in set (0.00 sec)

mysql> set optimizer_trace_max_mem_size=1000000;
Query OK, 0 rows affected (0.00 sec)

mysql> select rental_id from rental where 1=1 and rental_date>='2005-05-25 04:00:00' and rental_date<='2005-05-25 05:00:00' and inventory_id=4466;
+-----------+
| rental_id |
+-----------+
|        39 |
+-----------+
1 row in set (0.01 sec)

mysql> select * from information_schema.optimizer_trace\G
*************************** 1. row ***************************
                            QUERY: select rental_id from rental where 1=1 and rental_date>='2005-05-25 04:00:00' and rental_date<='2005-05-25 05:00:00' and inventory_id=4466
                            TRACE: {
  "steps": [
    {
      "join_preparation": {
        "select#": 1,
        "steps": [
        ................

索引问题

索引是数据库优化最常用是最要方法之一,本节讨论MySQL索引分类、存储、使用的方法。

索引存储分类

索引是MySQL存储引擎层中实现的,不是在服务层。故每种引擎所用不一定完全相同,MySQL目前提供4中索引:

  • B-Tree索引:常见索引,大部分引擎支持。
  • HASH索引:Memory引擎支持。
  • R-Tree索引(空间索引):为MyISAM的一个特殊索引类型,主要用于地理空间数据类型,使用较少。
  • Full-text(全文索引):MyISAM的特殊索引,InnoDB从5.6开始支持。

MySQL不支持函数索引,但可对列前某一部分进行索引,如title的前10个字符,该特性大大缩小了索引文件的大小,但是在排序分组时无法使用。

常用的索引为B-Tree索引和HASH索引,HASH只有Memory/Heap引擎支持,且只适用于Key-Value查询,通过Hash索引更快,但其不适用于范围查找,只有在where条件中是用“=”查找才会使用索引。

MySQL如何使用索引

B-Tree代表平衡树

MySQL中能使用索引的典型场景

  • 匹配全值,对索引中所有列都有等值匹配的条件。
mysql> desc select * from rental where rental_date='2005-05-25 17:22:10' and inventory_id=373 and customer_id=343\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: rental
   partitions: NULL
         type: const
possible_keys: rental_date,idx_fk_inventory_id,idx_fk_customer_id
          key: rental_date
      key_len: 10
          ref: const,const,const
         rows: 1
     filtered: 100.00
        Extra: NULL
1 row in set, 1 warning (0.00 sec)
  • 匹配值得范围查询,多索引的值能进行范围查找。
mysql> desc select * from rental where customer_id>=373 and customer_id<400 \G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: rental
   partitions: NULL
         type: range
possible_keys: idx_fk_customer_id
          key: idx_fk_customer_id
      key_len: 2
          ref: NULL
         rows: 718
     filtered: 100.00
        Extra: Using index condition
1 row in set, 1 warning (0.00 sec)

type为range表示选择范围查询,Extra列为Using where,表示优化器除了利用索引加速访问,还需要根据索引回表查询数据。

  • 匹配最左前缀,仅使用索引中最左边列进行查找。如在col1+col2+col3字段上的联合索引可被包含col1、(col1+col2)、(col1+col2+col3)的等值查询利用到,但是不能被col2、(col2+col3)的等值查询利用到。

最左匹配原则可以算是MySQL中B-Tree索引使用的首要原则

  • 仅对索引进行查询,当查询列都在索引的字段中时,查询效率更高。此时Extra部分可能变为了Using index,即不需要回表再查了。
  • 匹配列前缀,仅仅使用索引中的第一列,并只包含索引第一列的开头一部分进行查找。如查找标题title以AFRICAN开头的电影信息:
mysql> desc select title from film_text where title like 'AFRICAN%'\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: film_text
   partitions: NULL
         type: range
possible_keys: idx_title_desc_part,idx_title_description
          key: idx_title_desc_part
      key_len: 32
          ref: NULL
         rows: 1
     filtered: 100.00
        Extra: Using where
1 row in set, 1 warning (0.00 sec)
  • 能够实现索引匹配部分精确查找而其它部分进行范围匹配。
  • 如果列名是索引,那么使用column_name is null就会使用索引。
  • MySQL5.6引入了Index Condition Pushdown(ICP)的特性,进一步优化了查询。Pushdown表示操作下方,某些情况下的条件过滤操作下放到存储引擎。

存在索引但不能使用索引的典型场景

  • 以%开头的LIKE查询不能利用B-Tree索引,执行计划中key的值为NULL表示没有使用索引:
mysql> desc select * from actor where last_name like '%IN%'\G
*************************** 1. row ***************************
           id: 1
  select_type: SIMPLE
        table: actor
   partitions: NULL
         type: ALL
possible_keys: NULL
          key: NULL
      key_len: NULL
          ref: NULL
         rows: 200
     filtered: 11.11
        Extra: Using where
1 row in set, 1 warning (0.00 sec)

由于B-Tree索引的结构,故以%开头的查询无法利用索引,一般推荐使用全文索引(Fulltext)解决。

  • 数据类型出现影式的转换的时候不会使用索引,特别是当前类型是字符串,那么一定记得在where条件中把字符常量值用引号引起来。
  • 复合索引情况下,加入查询条件不包含索引列最左边部分,即不满足最左原则,不会使用复合索引。
  • 如果MySQL估计使用索引比全表扫描更慢,则不会使用索引。(在5.6版本中,可以查看到为何选择这个优化器)
  • 用or分割开的条件,如果or前条件中列有索引,后面的没有,则索引不会用到(后面肯定要使用全表扫面,就不必要多一次索引增加IO访问)。

查看索引使用情况

如果索引正在工作,Handler_read_key的值将很高,该值代表一个行被索引值读取的次数,很低说明增加索引得到的性能改善不高。Handler_read_rnd_next值高以为查询运行低效,应该建索引补救,该值含义为数据文件读下一行的请求数。

两个简单实用优化方法

定期分析表和检查表

分析/检查表语法:

分析:
ANALYZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE tbl_name [,tbl_name]...

检查:
CHECK TABLE tbl_name [,tbl_name] ... [option]...option={QUICK|FAST|MEDIUM|EXTENDED|CHANGED}

定期优化表

优化语法:

OPTIMIZE [LOCAL|NO_WRITE_TO_BINLOG] TABLE tbl_name [,tbl_name]...

如果已经删除表一部分或者对包含可变长度行的表进行了更改,应该实用OPTIMIZE TABLE优化表。该命令可将表中空间碎片合并,并消除由于删除更新操作造成的空间浪费。

对InnoDB引擎表,可通过设置innodb_file_per_table参数,设置InnoDB为独立表空间模式,这样每个数据库的每个表都会生成一个独立ibd文件,可一定程度上减轻InnoDB表的空间回收问题。
ANALYZE、CHECK、OPTIMIZE、ALTER TABLE执行期间会对表进行锁定,故注意在不忙的时候使用。

预告。。。
下一篇介绍常用SQL的优化,干货满满。

[完]

Github传送门

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,001评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,210评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,874评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,001评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,022评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,005评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,929评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,742评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,193评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,427评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,583评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,305评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,911评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,564评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,731评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,581评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,478评论 2 352

推荐阅读更多精彩内容