flink任务编程-java版-流-数据库to数据库

本文就flink流计算的任务工程模板做一介绍,初始数据源和计算结果数据存储都是通过JDBC连接到数据库。本文以mysql为数据库进行演示。

依赖包

        <dependency>
            <groupId>mysql</groupId>
            <artifactId>mysql-connector-java</artifactId>
            <version>8.0.15</version>
        </dependency>

工程结构说明

工程结构

本工程包含以下几个部分:

  1. 结构化数据定义(DTO),本文以常见的学生基本信息为示例。
package com.crazyice.lee.data;

import lombok.*;

@Data
@AllArgsConstructor
@NoArgsConstructor
@ToString(exclude = {"password","age"})
@RequiredArgsConstructor()
public class Student {
    private int studentId;
    private String name;
    private String password;
    private boolean sex;
    private int age;
}
  1. 任务编排,这里演示了一个完整流任务的各个关键环节,包括:环境配置、源数据读取(DataStreamSource)、处理过程(数据过滤筛选)、处理结果输出入库(DataSink)、启动任务执行等。
package com.crazyice.lee.jobs;

import com.crazyice.lee.data.Student;
import com.crazyice.lee.reader.JdbcReader;
import com.crazyice.lee.writer.JdbcWriter;
import lombok.extern.slf4j.Slf4j;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;

@Slf4j
public class Mysql2MysqlJob {

    public static void main(String[] args) throws Exception {
        //设置环境
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //获取数据-数据源
        DataStreamSource<Student> students = env.addSource(new JdbcReader());
        students.name("从mysql读取数据");

        //处理数据过程
        DataStream<Student> subStudents = students
                .filter(e -> e.isSex()).name("过滤男生")
                .filter(e -> e.getAge() > 12).name("过滤12岁以上");

        //写入数据-处理结果
        subStudents.addSink(new JdbcWriter()).name("写入备份学生库");
        env.execute("读取Mysql,数据过滤,写入Mysql");
    }
}
  1. 初始数据源、结果写入数据源配置,这部分通过实现RichSourceFunction、RichSinkFunction接口并配合配置文件实现,是相对固定的模式,如果要提高编程效率,可以考虑使用模板及配置的方式动态实现,因为代码结构固定,所以不在此处粘贴,如果感兴趣可以通过文章下面的开源链接查看。

测试验证

flink支持本地测试模式,可以在编码过程中排查错误,只需要在环境设置部分使用本地环境对象即可(将原先的getExecutionEnvironment()替换为createLocalEnvironment())也可以使用profile来进行编译配置。

        //设置环境
        final ExecutionEnvironment environment = properties.getProperty("local.running").equalsIgnoreCase("true") ? StreamExecutionEnvironment.createLocalEnvironment() : StreamExecutionEnvironment.getExecutionEnvironment();

源代码:(https://gitee.com/crazyicelee/flink

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 了解Flink是什么,Flink应用程序运行的多样化,对比业界常用的流处理框架,Flink的发展趋势,Flink生...
    JavaEdge阅读 5,174评论 1 18
  • feisky云计算、虚拟化与Linux技术笔记posts - 1014, comments - 298, trac...
    不排版阅读 4,383评论 0 5
  • 我是个特别特别喜欢怀旧的人,不喜欢更好身边的物品,不喜欢更新软件,不喜欢挑战新鲜事物。然后…讲个故事吧。 小时候一...
    如云阅读 277评论 0 1
  • 许久不来简书了。 “江南无所有,聊赠一枝春” 烂漫春季,姑苏城内,花海潮生。 见过许多挖采蒲公英的老人。一次是一对...
    泠生阅读 428评论 2 1
  • 写给自己的话: 对于家的思念,每个人都有不同的理解,或许是最熟悉的味道、最舒适的空间、最亲切的乡音、最爱的人…… ...
    小丢丢弟弟阅读 490评论 0 4

友情链接更多精彩内容