本篇文章讨论为处理WHERE子句而进行的优化。例子中使用了SELECT语句,但相同的优化也适用DELETE和UPDATE语句中的WHERE子句。
下面列出了MySQL执行的部分优化:
- 去除不必要的括号:
((a AND b) AND c OR (((a AND b) AND (c AND d))))
=>>
(a AND b AND c) OR (a AND b AND c AND d)
- 常量重叠:
(a<b AND b=c) AND a=5
b>5 AND b=c AND a=5
- 去除常量条件(由于常量重叠需要):
(B>=5 AND B=5) OR (B=6 AND 5=5) OR (B=7 AND 5=6)
=>>
B=5 OR B=6
- 索引使用的常数表达式仅计算一次。
1:对于MyISAM和HEAP表,在一个单个表上的没有一个WHERE的COUNT(*)直接从表中检索信息。当仅使用一个表时,对NOT NULL表达式也这样做。
2:无效常数表达式的早期检测。MySQL快速检测某些SELECT语句是不可能的并且不返回行。
3:如果不使用GROUP BY或分组函数(COUNT()、MIN()……),HAVING与WHERE合并。
对于联接内的每个表,构造一个更简单的WHERE以便更快地对表进行WHERE计算并且也尽快跳过记录。
4:所有常数的表在查询中比其它表先读出。常数表为:
a):空表或只有1行的表。
b):与在一个PRIMARY KEY或UNIQUE索引的WHERE子句一起使用的表,这里所有的索引部分使用常数表达式并且索引部分被定义为NOT NULL。
下列的所有表用作常数表:
mysql> SELECT * FROM t WHERE primary_key=1;
mysql> SELECT * FROM t1,t2 WHERE t1.primary_key=1 AND t2.primary_key=t1.id;
1: 尝试所有可能性便可以找到表联接的最好联接组合。如果所有在ORDER BY和GROUP BY的列来自同一个表,那么当联接时,该表首先被选中。
2: 如果有一个ORDER BY子句和不同的GROUP BY子句,或如果ORDER BY或GROUP BY包含联接队列中的第一个表之外的其它表的列,则创建一个临时表。
3: 如果使用SQL_SMALL_RESULT,MySQL使用内存中的一个临时表。
4: 每个表的索引被查询,并且使用最好的索引,除非优化器认为使用表扫描更有效。是否使用扫描取决于是否最好的索引跨越超过30%的表。优化器更加复杂,其估计基于其它因素,例如表大小、行数和I/O块大小,因此固定比例不再决定选择使用索引还是扫描。
5: 在一些情况下,MySQL能从索引中读出行,甚至不查询数据文件。如果索引使用的所有列是数值类,那么只使用索引树来进行查询。
6: 输出每个记录前,跳过不匹配HAVING子句的行
下面是一些快速查询的例子:
- SELECT COUNT(*) FROM tbl_name;
- SELECT MIN(key_part1),MAX(key_part1) FROM tbl_name;
- SELECT MAX(key_part2) FROM tbl_name WHERE key_part1=constant;
- SELECT ... FROM tbl_name ORDER BY key_part1,key_part2,... LIMIT 10;
- SELECT ... FROM tbl_name ORDER BY key_part1 DESC, key_part2 DESC, ... LIMIT 10;
- 下列查询仅使用索引树就可以解决(假设索引的列为数值型):
SELECT key_part1,key_part2 FROM tbl_name WHERE key_part1=val;
SELECT COUNT(*) FROM tbl_name
WHERE key_part1=val1 AND key_part2=val2;
SELECT key_part2 FROM tbl_name GROUP BY key_part1;
- 下列查询使用索引按排序顺序检索行,不用另外的排序:
SELECT ... FROM tbl_name
ORDER BY key_part1,key_part2,... ;
SELECT ... FROM tbl_name
ORDER BY key_part1 DESC, key_part2 DESC, ... ;