业务面故障处理流程如图1所示,以acjob任务(使用Ascend Operator)为例。
各步骤说明如下:
默认删除任务的所有Pod,若用户使用Pod级别重调度功能,则只删除故障Pod,重新创建并拉起该Pod。