执行计划分析 · datalake · 正则表达式(20220625)


一、背景

 本文介绍正则表达式解析数据分析引擎所产生的执行计划,最后能够以易懂的方式分析执行计划,进而为SQL优化提供帮助。

二、正则表达式

基础语法: "^([]{})([]{})([]{})$"

正则字符串 = "开始([包含内容]{长度})([包含内容]{长度})([包含内容]{长度})结束"

二、解析案例

1.Gather Motion

输入:Gather Motion 2:1  (slice1; segments: 2)  (cost=0.00..431.00 rows=1 width=8)

规则:(.*) \((cost=(.*)\.\.(.*) ){0,1}rows=(.*) width=(.*)\)

解读:"(.*)任意长度文本"   "\( 转义左括号"  

            "cost=文本开头 (.*)任意文本  \.\. 两个点 (.*) 任意文本 ){0,1} 长度为0或1" 

图1 类型匹配

2.域段分解

图3 域段


三、项目代码

https://github.com/sinwaj/planchecker

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容