Springboot集成batch+quartz

最近团队在做网络爬虫活动,于是就有了批处理+定时任务的需求。于是简单研究了以下springboot对springbatch和quartz的集成。

大致流程如下:

batch

Spring-Batch

batch最核心的三大步骤就是

  • 读数据reader
  • 处理数据processer
  • 写数据writer

reader

public class ProductReader implements ItemReader<Object> {

    @Override
    public Object read() throws Exception, UnexpectedInputException, ParseException, NonTransientResourceException {
        //数据读取器,可以自定义数据源,可以是文件,也可以是数据库。
        //将数据读取出来并返回到当前的batch中。
        return null;
    }
}

这里是最常规的读取数据,可以自定义数据源,获取数据(文件,数据库,消息队列等)。也可以使用batch提供的封装类获取数据FlatFileItemReaderJdbcCursorItemReader,只需要配置对应的数据源即可。

processer

public class ProductProcessor implements ItemProcessor<Object, List<Product>> {

    @Override
    public List<Product> process(Object obj) throws Exception {
        //处理数据
        return null;
    }
}

将reader读取出来的数据处理成需要的业务模型的数据并返回。

writer

public class ProductWriter implements ItemWriter<List<Product>> {

    @Override
    public void write(List<? extends List<Product>> list) throws Exception {
        //save or update
    }
}

将处理后的数据做入库处理。

config


    @Bean
    public Step step1() {
        return stepBuilderFactory.get("step1")//创建一个step
                .<Object, List<Product>> chunk(10)//每次执行的次数
                .reader(productReader)//设置读处理器
                .processor(productProcessor)//设置处理器
                .writer(productWriter)//设置写处理器
                .build();
    }

    @Bean
    public Job etlJob(){
        return jobBuilderFactory.get("etlJob")//创建一个batch-job
                .incrementer(new RunIdIncrementer())
                .listener(jobCompletionNotificationListener)//设置任务监听
                .flow(step1())
                .end()
                .build();
    }

Spring-Batch集成Quartz

由于SpringBatch只提供了批处理任务,但是没有任务调度,所以我们用batch+quartz完成批处理的任务调度。

config

    
    private CronTriggerFactoryBean createTrigger(JobDetail detail, String expression){
        CronTriggerFactoryBean cron = new CronTriggerFactoryBean();
        cron.setJobDetail(detail);
        cron.setCronExpression(expression);
        return cron;
    }

    private JobDetailFactoryBean createJobDetail(String jobName, String filePath, Source source){
        JobDetailFactoryBean factory = new JobDetailFactoryBean();
        //设置quartz任务
        factory.setJobClass(QuartzJobLauncher.class);
        //spring-batch任务的配置
        Map<String, Object> map = Maps.newHashMap();
        map.put("jobName", jobName);//batch的任务名
        map.put("jobLauncher", jobLauncher);//任务触发器,用来执行batchjob
        map.put("jobLocator", jobLocator);//任务定位器,可以通过name获取batchjob
        map.put("filePath", filePath);//etl的一些其它配置
        map.put("source", source);
        factory.setJobDataAsMap(map);
        return factory;
    }
    
    @Bean
    public JobDetailFactoryBean jdJobDetail(){
        return createJobDetail("etlJob", "src/main/resources/html/jd/iphone", Source.JD);
    }

    @Bean
    public CronTriggerFactoryBean jdTrigger(){
        return createTrigger(jdJobDetail().getObject(), "*/20 * * * * ? *");
    }
    
    @Bean
    public SchedulerFactoryBean schedulerFactoryBean(){
        SchedulerFactoryBean scheduler = new SchedulerFactoryBean();
        scheduler.setTriggers(jdTrigger().getObject());
        return scheduler;
    }

QuartzJobLauncher

@Data
public class QuartzJobLauncher extends QuartzJobBean {

    @Override
    protected void executeInternal(JobExecutionContext jobExecutionContext) throws JobExecutionException {
        //通过quartz的上下文,获取quartzjob的配置,然后转换为batchjob的配置。
        JobDataMap map = jobExecutionContext.getMergedJobDataMap();
        JobParameters jobParameters = new JobParametersBuilder()
                .addString("filePath", map.getString("filePath"))
                .addString("source", map.get("source").toString())
                .addLong("time", System.currentTimeMillis())
                .toJobParameters();
        try {
            //获取batch-job
            Job job = jobLocator.getJob(jobName);
            //执行job
            jobLauncher.run(job, jobParameters);
        } catch (JobExecutionAlreadyRunningException | JobInstanceAlreadyCompleteException |
                NoSuchJobException | JobParametersInvalidException | JobRestartException e) {
            e.printStackTrace();
        }
    }
}

通过quartz配置quartz的定时任务,然后在QuartzJobLauncher中执行Spring-Batch的job任务。而且可以设置config中的factory.setJobDataAsMap(map);,设置每个quartz-job的参数,通过JobExecutionContext.getMergedJobDataMap()获取。再设置batchJobParameters。这样的话就可以在readerprocesserwriter中获取,具体获取方法如下:

    @Value("#{jobParameters['filePath']}")
    private String filePath;
    @Value("#{jobParameters['source']}")
    private String source;

总结

spring-batch非常方便的提供大量数据的批处理任务。可以通过配置JobExecutionListenerSupport来自己实现一个简单的任务的监控。

    @Override
    public void afterJob(JobExecution jobExecution) {
        if(jobExecution.getStatus() == BatchStatus.COMPLETED) {
            //do something after job
        }
    }

    @Override
    public void beforeJob(JobExecution jobExecution) {
        //do something before job
    }

spring-batch还有很多其它特性,比如事务管理、启动、终止、重启任务、跳过、任务的日志、监控等特性。后续将介绍这些特性。

©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 213,014评论 6 492
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 90,796评论 3 386
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 158,484评论 0 348
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 56,830评论 1 285
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 65,946评论 6 386
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 50,114评论 1 292
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 39,182评论 3 412
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 37,927评论 0 268
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 44,369评论 1 303
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 36,678评论 2 327
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 38,832评论 1 341
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 34,533评论 4 335
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 40,166评论 3 317
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 30,885评论 0 21
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 32,128评论 1 267
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 46,659评论 2 362
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 43,738评论 2 351

推荐阅读更多精彩内容