术语表
Spring Batch 词汇表
- 批处理
-
随着时间推移积累的业务事务。
- 批处理应用风格
-
用于将批处理指定为一种独立的应用程序风格的术语,类似于在线、Web 或 SOA。它具有输入、验证、信息转换到业务模型、业务处理和输出等标准元素。此外,它还需要宏观层面的监控。
- 批处理
-
处理在一段时间内(例如一小时、一天、一周、一个月或一年)积累的大量业务事务。它是以重复和可预测的方式对许多数据实体或对象应用一个或一组过程,其中要么没有手动元素,要么有单独的手动元素用于错误处理。
- 批处理窗口
-
批处理作业必须完成的时间范围。这可能会受到其他系统上线、其他依赖作业需要执行或批处理环境特有的其他因素的限制。
- 步骤
-
主要的批处理任务或工作单元。它根据提交间隔设置和其他因素初始化业务逻辑并控制事务环境。
- 任务
-
由应用程序开发人员创建的用于处理步骤业务逻辑的组件。
- 批处理作业类型
-
作业类型描述了作业在特定处理类型中的应用。常见的领域包括接口处理(通常是平面文件)、表单处理(用于在线 PDF 生成或打印格式)和报告处理。
- 驱动查询
-
驱动查询识别作业要完成的工作集。然后,作业将该工作分解为单个工作单元。例如,驱动查询可能是识别所有状态为“待传输”的金融交易并将其发送到合作伙伴系统。驱动查询返回要处理的记录 ID 集。每个记录 ID 都成为一个工作单元。驱动查询可能涉及连接(如果选择条件跨越两个或更多表),或者它可能处理单个表。
- 项
-
项表示用于处理的最小完整数据量。最简单地说,这可能是一个文件中的一行、数据库表中的一行或 XML 文件中的特定元素。
- 逻辑工作单元 (LUW)
-
批处理作业通过驱动查询(或文件等其他输入源)迭代,以执行作业必须完成的工作集。每次执行的工作迭代都是一个工作单元。
- 提交间隔
-
在单个事务中处理的一组 LUW。
- 分区
-
将作业拆分为多个线程,每个线程负责处理整体数据的一个子集。执行线程可以在同一个 JVM 中,也可以跨集群环境中支持工作负载平衡的 JVM。
- 暂存表
-
在处理过程中保存临时数据的表。
- 可重启
-
可以再次执行并假定与初次运行时相同身份的作业。换句话说,它具有相同的作业实例 ID。
- 可重跑
-
一个可重启的作业,它根据上次运行的记录处理情况管理自己的状态。基于驱动查询的步骤就是可重跑步骤的一个示例。如果驱动查询可以形成,以便在作业重启时限制已处理的行,那么它是可重跑的。这由应用程序逻辑管理。通常,
where语句中会添加一个条件,以使用类似于and processedFlag!= true的逻辑来限制驱动查询返回的行。 - 重复
-
批处理最基本的单元之一,它通过重复调用部分代码来定义,直到代码完成且没有错误。通常,只要有输入,批处理过程就可以重复。
- 重试
-
简化了具有重试语义的操作的执行,这些语义最常与处理事务性输出异常相关联。重试与重复略有不同。重试不是持续调用一个代码块,而是有状态的,并持续使用相同的输入调用相同的代码块,直到成功或超过某种重试限制。它通常只有在环境中的某些情况有所改善,后续调用操作可能成功时才有用。
- 恢复
-
恢复操作以某种方式处理异常,使重复过程能够继续。
- 跳过
-
跳过是一种恢复策略,常用于文件输入源,作为忽略未能通过验证的错误输入记录的策略。