Mysql的几个灵魂拷问(四)

Mysql前面已经把基础和原理部分铺垫的差不多了,现在要来讲讲的是Sql优化和调优部分了,这个基本是Mysql拷问系列最直接灵魂的环节了,优化这几乎是每场面试对话的最高潮部分,但这里又是一个开放的话题,能不能绽放出亮点,就看平时在调优方面下的功夫够不够了,数据库优化维度有四个:硬件、系统配置、数据库表结构、SQL及索引。这一篇的重点是放在SQL语句的优化上,表设计与大表优化方案则放在下一个篇文章中。

一、总优化思路

对于程序开发者来说,MySQL层优化一般可以遵从五个原则:

  • 减少数据访问:设置合理的字段类型,启用压缩,通过索引访问等减少磁盘 IO。
  • 返回更少的数据:只返回需要的字段和数据分页处理,减少磁盘 IO 及网络 IO。
  • 减少交互次数:批量 DML 操作,函数存储等减少数据连接次数。
  • 减少服务器 CPU 开销:尽量减少数据库排序操作以及全表查询,减少 CPU 内存占用
  • 利用更多资源:使用表分区,可以增加并行操作,更大限度利用 CPU 资源。

总结到 SQL 优化中,就如下三点:

  • 最大化利用索引。
  • 尽可能避免全表扫描。
  • 减少无效数据的查询。

二、索引优化策略


众所周知,索引类似于字典的目录,可以提高查询的效率。索引从物理上可以分为:聚集索引,非聚集索引。从逻辑上可以分为:普通索引,唯一索引,主键索引,联合索引,全文索引。这一部分主要总结Sql优化的一些技巧和规范,尤其对于一些还有歧义和误导性的说法做一个纠正。

1、合理建立覆盖索引

合理的覆盖索引,可以减少回表次数。表数据是放在一个聚集索引上的,而建立的索引为非聚集索引,非聚集索引的叶子节点存放索引键值,以及该索引键指向的主键。一般查找的过程是从非聚集索引上找到数据的主键,然后根据该主键到聚集索引上查找记录,这个过程称为回表。

如有下面这个sql

select uid, login_time from user where username = ? and passwd = ?

可以建立(username, passwd, login_time)的联合索引,由于 login_time的值可以直接从索引中拿到,不用再回表查询,提高了查询效率。

建立联合索引的时候注意将区分度最高的字段放在最左边!

2、union,or,in都能命中索引,建议使用in

新版Mysql中union,or,in都是会走索引的,所以如下三条sql语句都是等价的:

select * from article where id = 1
union all
select * from article where id = 2

select * from article where id in (1 , 2)

select * from article where id = 1 or id = 2

效率从高到低为union,in,or。in和union的效率差别可以忽略不计,所以直接建议使用in。union 比 union all 多一个去重逻辑,业务上知道已经有字段有唯一属性的话,直接用union all 会比 union 效率更高点儿。

exist和in的差别,并不是exist替换都比in要好:

  • 子查询使用 exists,会先进行主查询,将查询到的每行数据循环带入子查询校验是否存在,过滤出整体的返回数据;子查询使用 in,会先进行子查询获取结果集,然后主查询匹配子查询的结果集,返回数据
  • 外表内表相对大小情况不一样时,查询效率不一样:两表大小相当,in 和 exists 差别不大;内表大,用 exists 效率较高;内表小,用 in 效率较高。
  • 不管外表与内表的大小,not exists 的效率一般要高于 not in,跟子查询的索引访问类型有关。

负向条件索引不会使用索引,建议用in

负向条件有:!=、<>、not in、not exists、not like 等

-- 全表扫描
select * from article where id != 1 and id != 2

知道id的所有取值范围,可以改为类似如下形式

-- 走索引
select * from article where id in (0, 3, 4)

在索引列上进行运算或使用函数会走全表

在列上进行运算或使用函数会使索引失效,从而进行全表扫描。如下面例子在publish_time,id列上分别加上索引,publish_time为datetime类型,id为int类型:

-- 全表扫描
select * from article where year(publish_time) < 2019
-- 走索引
select * from article where publish_time < '2019-01-01'
-- 全表扫描
select * from article where id  + 1 = 5
-- 走索引
select * from article where id = 4

小心隐式类型转换

假设id为varchar类型,用int类型查会走全表。

-- 全表扫描
select * from article where id = 100
-- 走索引
select * from article where id = '100'

隐式类型转换在索引字段上做了函数操作,因此会全表扫描。

select * from article where id = 100
-- 等价于
select * from article where CAST(id AS signed int) = 100

那么如果id是int,执行下面这个语句是否会导致全表扫描呢?select * from article where id = '100',答案是会用到索引。

不建议使用%前缀模糊查询

%李,%李%都会导致全表扫描,非前导模糊查询可以使用索引

避免在where子句中进行null值判断

对于null的判断会导致引擎放弃使用索引而进行全表扫描。

经常更改,区分度不高的列上不宜加索引

  • 更新会变更 B+ 树,更新频繁的字段建立索引会大大降低数据库性能。
  • 一般区分度在80%以上的时候就可以建立索引。

区分度可以使用 count(distinct(列名))/count(*) 来计算
“性别”这种区分度不大的属性,建立索引是没有什么意义的,不能有效过滤数据,性能与全表扫描类似。

多表关联查询时,小表在前,大表在后

在 MySQL 中,执行 from 后的表关联查询是从左往右执行的(Oracle 相反),第一张表会涉及到全表扫描。

调整 Where 字句中的连接顺序

MySQL 采用从左往右,自上而下的顺序解析 where 子句。根据这个原理,应将过滤数据多的条件往前放,最快速度缩小结果集。

查询是否存在可以加limit1

查询是否存在或者当查询确定只有一条记录时,可以加liimit1,让MySQL停止游标移动,提高查询效率

select uid from user where username = ? and passwd = ?

可改为:

select uid from user where username = ? and passwd = ? limit 1

Explain调优


说了这么多的优化总结,最重要的可能还是通过分析手段去,使用explain关键字可以模拟优化器执行SQL语句,号称SQL中的debug。通过explain可以知道mysql是如何处理sql语句,分析查询语句或者表结构的性能瓶颈。

explain + SQL

explain包含很多的Item,主要关注type,possible_key,key,row和Extra。
id:执行权重,查询多张表后对应的id越大优先级越高
type:查询使用的类型,system > const > eq_ref > ref > range > index > all

        system 只有一行数据,一般不出现
        const 通过索引一次就找到
        eq_ref  唯一性索引扫描
        ref  非唯一性索引扫描
        range 检索制定范围
        index 只遍历索引树
        all 全表扫描

table:表名
possible_key:表中存在的索引
key:本次查询使用的索引
row:找到目标大致所需的行数
Extra:

        using filesort 使用外部的索引排序
        using temporary 使用临时表保存数据
        using index 使用了覆盖索引
        using where 使用where条件
        using join buffer 使用连接缓存
        impossible  where where条件无结果
        select tables optimized away 最佳优化状态,无需遍历索引

优化思路还是沿着我们上面总结的那些来进行即可。

  • 使用 explain 分析语句时若发现 rows 非常大的查询语句可以考虑在对应的关键词上加入索引
  • 用联合索引来减少回标次数
  • 如果列类型是字符串,那一定要在条件中将数据使用引号引用起来,否则不会使用索引
  • 应尽量避免在 where 子句中使用!=<> not in、not exisit等负向条件的操作符,改成in之类。
  • 避免在where后面用函数或者计算,走全表了
  • 避免在where后面做null值判断
  • 在搜索字符型字段时,我们有时会使用LIKE关键字和通配符,避免前缀也是模糊。

参考引用


1、这次被问懵了!搞定了这些SQL优化技巧,下次横着走
2、MySQL索引优化实战
3、巧用 explain 优化 MySQL 语句

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 216,039评论 6 498
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 92,223评论 3 392
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 161,916评论 0 351
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 58,009评论 1 291
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 67,030评论 6 388
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 51,011评论 1 295
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,934评论 3 416
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 38,754评论 0 271
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 45,202评论 1 309
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 37,433评论 2 331
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 39,590评论 1 346
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 35,321评论 5 342
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,917评论 3 325
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 31,568评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,738评论 1 268
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 47,583评论 2 368
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 44,482评论 2 352