为重新启动配置 Step
在“配置和运行 Job”一节中,我们讨论了重新启动 Job。重启对步骤有诸多影响,因此可能需要一些特定的配置。
设置启动限制
在许多场景中,您可能希望控制 Step 可以启动的次数。例如,您可能需要配置一个特定的 Step,使其只运行一次,因为它会使某些资源失效,这些资源在再次运行之前必须手动修复。这可以在步骤级别进行配置,因为不同的步骤可能有不同的要求。一个只能执行一次的 Step 可以与一个可以无限运行的 Step 作为同一个 Job 的一部分存在。
-
Java
-
XML
以下代码片段展示了 Java 中启动限制配置的示例
@Bean
public Step step1(JobRepository jobRepository, PlatformTransactionManager transactionManager) {
return new StepBuilder("step1", jobRepository)
.<String, String>chunk(10).transactionManager(transactionManager)
.reader(itemReader())
.writer(itemWriter())
.startLimit(1)
.build();
}
以下代码片段展示了 XML 中启动限制配置的示例
<step id="step1">
<tasklet start-limit="1">
<chunk reader="itemReader" writer="itemWriter" commit-interval="10"/>
</tasklet>
</step>
上述示例中的步骤只能运行一次。尝试再次运行它会导致抛出 StartLimitExceededException。请注意,启动限制的默认值为 Integer.MAX_VALUE。
重新启动已完成的 Step
在可重启的作业中,可能有一个或多个步骤应始终运行,无论它们第一次是否成功。例如,一个验证步骤或一个在处理之前清理资源的 Step。在重新启动的作业的正常处理过程中,任何状态为 COMPLETED(表示已成功完成)的步骤都会被跳过。将 allow-start-if-complete 设置为 true 会覆盖此行为,使该步骤始终运行。
-
Java
-
XML
以下代码片段展示了如何在 Java 中定义一个可重启的作业
@Bean
public Step step1(JobRepository jobRepository, PlatformTransactionManager transactionManager) {
return new StepBuilder("step1", jobRepository)
.<String, String>chunk(10).transactionManager(transactionManager)
.reader(itemReader())
.writer(itemWriter())
.allowStartIfComplete(true)
.build();
}
以下代码片段展示了如何在 XML 中定义一个可重启的作业
<step id="step1">
<tasklet allow-start-if-complete="true">
<chunk reader="itemReader" writer="itemWriter" commit-interval="10"/>
</tasklet>
</step>
Step 重启配置示例
-
Java
-
XML
以下 Java 示例展示了如何配置一个包含可重启步骤的作业
@Bean
public Job footballJob(JobRepository jobRepository, Step playerLoad, Step gameLoad, Step playerSummarization) {
return new JobBuilder("footballJob", jobRepository)
.start(playerLoad)
.next(gameLoad)
.next(playerSummarization)
.build();
}
@Bean
public Step playerLoad(JobRepository jobRepository, PlatformTransactionManager transactionManager) {
return new StepBuilder("playerLoad", jobRepository)
.<String, String>chunk(10).transactionManager(transactionManager)
.reader(playerFileItemReader())
.writer(playerWriter())
.build();
}
@Bean
public Step gameLoad(JobRepository jobRepository, PlatformTransactionManager transactionManager) {
return new StepBuilder("gameLoad", jobRepository)
.allowStartIfComplete(true)
.<String, String>chunk(10).transactionManager(transactionManager)
.reader(gameFileItemReader())
.writer(gameWriter())
.build();
}
@Bean
public Step playerSummarization(JobRepository jobRepository, PlatformTransactionManager transactionManager) {
return new StepBuilder("playerSummarization", jobRepository)
.startLimit(2)
.<String, String>chunk(10).transactionManager(transactionManager)
.reader(playerSummarizationSource())
.writer(summaryWriter())
.build();
}
以下 XML 示例展示了如何配置一个包含可重启步骤的作业
<job id="footballJob" restartable="true">
<step id="playerload" next="gameLoad">
<tasklet>
<chunk reader="playerFileItemReader" writer="playerWriter"
commit-interval="10" />
</tasklet>
</step>
<step id="gameLoad" next="playerSummarization">
<tasklet allow-start-if-complete="true">
<chunk reader="gameFileItemReader" writer="gameWriter"
commit-interval="10"/>
</tasklet>
</step>
<step id="playerSummarization">
<tasklet start-limit="2">
<chunk reader="playerSummarizationSource" writer="summaryWriter"
commit-interval="10"/>
</tasklet>
</step>
</job>
上述示例配置是一个作业,用于加载足球比赛信息并进行汇总。它包含三个步骤:playerLoad、gameLoad 和 playerSummarization。playerLoad 步骤从平面文件加载球员信息,而 gameLoad 步骤对比赛执行相同的操作。最后一步 playerSummarization,然后根据提供的比赛汇总每个球员的统计数据。假设 playerLoad 加载的文件只能加载一次,但 gameLoad 可以加载特定目录中找到的任何比赛,并在成功加载到数据库后将其删除。因此,playerLoad 步骤不包含任何额外配置。它可以启动任意次数,如果完成则跳过。然而,gameLoad 步骤需要每次都运行,以防上次运行后又添加了额外的文件。它将 allow-start-if-complete 设置为 true 以始终启动。(假设加载比赛的数据库表上有一个处理指示器,以确保汇总步骤可以正确找到新比赛)。汇总步骤是作业中最重要的步骤,配置为启动限制为 2。这很有用,因为如果该步骤持续失败,则会向控制作业执行的操作员返回新的退出代码,并且在手动干预之前无法再次启动。
此作业为本文档提供了一个示例,与示例项目中找到的 footballJob 不同。 |
本节的其余部分描述了 footballJob 示例的三次运行中发生的情况。
第 1 次运行
-
playerLoad运行并成功完成,向PLAYERS表添加了 400 名球员。 -
gameLoad运行并处理了 11 个文件的比赛数据,将其内容加载到GAMES表中。 -
playerSummarization开始处理并在 5 分钟后失败。
第 2 次运行
-
playerLoad不运行,因为它已成功完成,并且allow-start-if-complete为false(默认值)。 -
gameLoad再次运行并处理另外 2 个文件,也将其内容加载到GAMES表中(带有一个指示尚未处理的进程指示器)。 -
playerSummarization开始处理所有剩余的比赛数据(使用进程指示器进行过滤)并在 30 分钟后再次失败。
第 3 次运行
-
playerLoad不运行,因为它已成功完成,并且allow-start-if-complete为false(默认值)。 -
gameLoad再次运行并处理另外 2 个文件,也将其内容加载到GAMES表中(带有一个指示尚未处理的进程指示器)。 -
playerSummarization未启动,作业立即终止,因为这是playerSummarization的第三次执行,其限制仅为 2。必须提高限制,或者将Job作为新的JobInstance执行。