Flink sql 预览 执行结果

基于flink 1.9.1 扩展

场景

公司基于flink sql 二次开发了etl 功能。
其中有一个场景是要根据输入,实时预览sql执行后的结果。
比如有这样一条sql

select cast(order_id as bigint),
          str_to_timestamp('2017-11-01 23:59:55','yyyy-MM-dd HH:mm:ss'),
          false, 
          is_exist('order_id'),
          to_base64('hello'),
          ['3','4'],
         __baas__all__ 
        from order_source   

说明:

  1. order_source是 kafka中流表
  2. ['3','4'] 是我扩展flink sql后定义数组的方式,对应原生Array['3','4']
  3. 输出的数据同样返回到kafka中

有以下几种方案可以实现

  1. 本地启动flink,实际执行
  2. 解析sql,自己实现

第一种方式 开销太大,即使是以local模式启动也不能接受
第二种方式 与flink sql内部实现不一致,到时候数据输出也会不一致

我当时想如果能够在一个方法中过一遍flink 的operator就好了,这样免除了启动flink 各种组件的开销,又能保持数据一致。说做就做

设计与实现如下

  1. flink 内部使用calcite 解析sql,生成ast,然后validate->optimatize。优化后的语法树,就用经典的火山模型老一套,生成Transformations,也就是DAG。
        Planner planner = tableEnv.getPlanner();
        StreamPlanner streamPlanner = (StreamPlanner) planner;

        //反射获取private 字段
        List<ModifyOperation> bufferedModifyOperations = BeanUtil.getField(TableEnvironmentImpl.class, tableEnv, "bufferedModifyOperations");
        List<Transformation<?>> translate = streamPlanner.translate(bufferedModifyOperations);

flink内部做了一些转换,我们调用tableEnv.sqlQuery 的时候,生成Operation缓存起来,execute时候再生成Transformation。
通过上述代码我们可以获取Transformation。

  1. 从source到sink 排列transform,假设只有一个 sink,取数组第一个元素。
    这种火山模型的转换,默认是从sink执行execute,不断获取input,我们用栈
        Transformation next = translate.get(0);
        LinkedList<Transformation> linkedList = new LinkedList<>();
        while (next != null) {
            linkedList.push(next);
            if (next instanceof SinkTransformation) {
                next = ((SinkTransformation<?>) next).getInput();
            } else if (next instanceof OneInputTransformation) {
                next = ((OneInputTransformation<?, ?>) next).getInput();
            } else if (next instanceof SourceTransformation) {
                next = null;
            } else {
                //不支持TwoInput,需要可以自己扩展
                throw new UnsupportedOperationException();
            }
        }
最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

推荐阅读更多精彩内容

  • 今天感恩节哎,感谢一直在我身边的亲朋好友。感恩相遇!感恩不离不弃。 中午开了第一次的党会,身份的转变要...
    迷月闪星情阅读 10,620评论 0 11
  • 彩排完,天已黑
    刘凯书法阅读 4,339评论 1 3
  • 表情是什么,我认为表情就是表现出来的情绪。表情可以传达很多信息。高兴了当然就笑了,难过就哭了。两者是相互影响密不可...
    Persistenc_6aea阅读 126,303评论 2 7