SQL"潜规则"

1.中间表尽量少,中间表指的是 create tmp table等临时表,因为这部分临时表要读写内存,也会起job,所以,如果想让执行时间变快,尽量减少中间表得数量。
2.少用union all。union all会导致数据量激增,同时也会有数据倾斜得风险,同时在union all过多得时候,如果字段没对上,还容易增加犯错概率。
3.少用子查询。每增加一个from或者每增加一个join,就会增加一个mr任务,从而增加任务执行时长。
4.不要在where中添加判断条件。目的也是减少mr任务。
5.合并小文件。
6.最后关联维表,或者把维表放在前面。
----部分内容引自木东居士

©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容