约束条件
- 本特性目前仅支持使用集群调度组件的K8s集群。
- 本特性依赖集群调度组件中Volcano和Asend Device Plugin两个组件,在重调度策略开启的情况下,Ascend Device Plugin的异常也会触发故障重调度。
- 本特性仅支持Deployment类型任务,且需在该类任务中增加故障重调度的开关的标签“fault-scheduling”,并将其设置为“grace”,不支持“fault-scheduling: force”。
- 支持昇腾硬件如表 支持昇腾硬件所示。
父主题: 推理故障容错使用示例