1、 优化器
优化器(Optimizer)是SQL分析和执行的优化工具,它负责生成、制定SQL的执行计划。主要有以下两种优化器:
RBO: Rule-Based Optimization 基于规则的优化器
CBO: Cost-Based Optimization 基于成本的优化器
Oracle数据库两种优化器都支持,默认启用CBO,mysql数据库只支持CBO。
假设emp表有1000万条数据,在deptno字段有单列索引emp_deptno_idx。
select * from emp where deptno=10;
RBO中有一条规则:有索引就用索引。以上面这条sql为例,RBO优化器会先取出索引emp_deptno_idx,通过where条件deptno=10过滤出符合条件数据,根据过滤后数据的rowid再从emp表里取整条数据(这个操作叫做"回表")。当emp表的deptno字段值分布比较均匀,譬如有10万种值,每种值大约10条,此时基于RBO的优化走索引会取得很好的优化效果;但是当deptno字段值比较集中,有99.99万条数据是10时,此时基于RBO的优化走索引非但不能取得好的优化效果,反而会因先取索引进行比较再回表取数据降低查询性能。
对于CBO优化器,在制定执行计划的时候会先计算下成本,对于以上sql,以直接走全表查询和先走索引再回表查询这两种执行方式为例,CBO优化器会先取得emp表deptno字段数据的分布情况数据,然后根据取得的数据计算究竟是直接走全表代价比较低还是先走索引再回表代价比较低,最后选择成本最小的方式作为执行计划。当deptno字段值分布比较均匀时,CBO会先走索引再回表,当deptno字段值分布比较集中时,CBO会直接走全表。
2、执行计划
如果把一条sql比作一元二次方程ax²+bx+c=0(a≠0),那么执行计划就好比我们的求解公式:
显然,对于一元二次方程,除了直接用求根公式,我们还可以用配方法等其他方法求解,具体选用哪种方法求解,那就看哪种方法更快速了。
3、sql执行过程
当第一条sql进来时,客户端->连接器->缓存->分析器->优化器->执行器,此时数据库会为该sql生成一个执行计划。当相同的sql再次进来查询时,数据库会先从缓存里面查找,若找到上次执行的结果就直接返回。
当第二条sql进来时,如果这条sql和第一条sql用的是同一个 PreparedStatement,只是参数值不同,此时会直接在缓存中找出执行第一条sql时生成的执行计划,用于第二条sql的执行。即执行路径为客户端->连接器->缓存->执行器,少了分析器和优化器这两个极度耗时的硬解析步骤,对于结构复杂但是数据量少的sql,sql执行效率比不使用PreparedStatement反复解析sql生成执行计划能获得大幅度的性能上的提升(硬解析一方面会消耗CPU资源,另一方面,保存大量类似的执行计划,需要消耗大量的内存资源,所以,理论上,所有sql的执行都应该使用PreparedStatement而不用Statement)。