从 TPCH 测试学习性能优化技巧之 Q6

一、     查询要求

Q6语句查询得到某一年中通过变换折扣带来的增量收入。这是典型的"what-if"判断,用来寻找增加收入的途径。预测收入变化查询考虑了指定的一年中折扣在"DISCOUNT-0.01"和"DISCOUNT+0.01 "之间的已运送的所有订单,求解把l_quantity小于quantity的订单的折扣消除之后总收入增加的数量。

Q6语句的特点是:带有聚集操作的单表查询操作。查询语句使用了BETWEEN-AND操作符,有的数据库可以对BETWEEN-AND进行优化。


二、     Oracle执行

Oracle编写的查询SQL语句如下:

select  /*+ parallel(n) */

         sum(l_extendedprice * l_discount) as revenue

from

         lineitem

where

         l_shipdate >= date '1995-01-01'

         and l_shipdate < date '1995-01-01' + interval '1' year

         and l_discount between 0.05 - 0.01 and 0.05 + 0.01

         and l_quantity < 24;

其中/*+ parallel(n) */ 是Oracle的并行查询语法,n是并行数。

脚本执行时间,单位:秒

并行数124812

Oracle328240183154135


三、     SPL优化

这是一个常规的过滤后聚合查询,结果集只有一条记录,没有特殊的优化技术,跟Q1一样使用多路游标充分利用并行即可。

SPL脚本如下:

A

1=1

2=now()

3>date=date("1995-01-01")

4>discount=0.05

5>quantity=24

6=elapse@y(date,1)

7=file(path+"lineitem.ctx").create().cursor@m(L_EXTENDEDPRICE,L_DISCOUNT;L_SHIPDATE>=date   && L_SHIPDATE < A6 && L_DISCOUNT >= discount - 0.01   && L_DISCOUNT <= discount + 0.01 && L_QUANTITY <   quantity;A1)

8=A7.groups(;sum(L_EXTENDEDPRICE*L_DISCOUNT):revenue)

9=now()

10=interval@s(A2,A9)

这里也使用了创建游标时即进行数据过滤以减少读取量的技巧(这个技巧在SPL中很常用,后面的例子中都有用到,后文中不再赘述)。


脚本执行时间,单位:秒

并行数124812

Oracle328240183154135

SPL组表11058342112

因为数据量比较大,组表的列存优势比较明显。

©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

友情链接更多精彩内容