昇腾社区首页
中文
注册

增量学习流水线运行失败,无法正常上传标注

问题描述

在某些偶然的情况下,流水线运行过程中组件报错后由于底层依赖的WFE调度器没有正确调度exit组件将运行状态复原,导致任务处于运行状态/上传状态显示为正在运行中,但实际上流水线已经报错退出的状态,导致无法再次上传标注触发流水线。

解决措施

可以将任务停止后重启,通过对状态文件进行复位消除错误状态,方可再次上传标注数据。