昇腾社区首页
中文
注册

tft_register_clean_handler

接口功能

注册在恢复过程中,清理残留算子执行的回调函数。

对于MindSpeed-LLM和MindSpeed训练框架,回调函数已由MindIO TFT完成适配;其他框架,回调函数的安全性需由用户保证。

接口格式

mindio_ttp.framework_ttp.tft_register_clean_handler(func: Callable, ctx = None)

接口参数

参数

是否必选

说明

取值要求

func

必选

清理残留算子执行的回调函数,完成清理残留算子、底层故障的功能。

回调函数,不为空,回调函数入参要求请参见表1

约定该回调函数返回值:

  • 0:成功。
  • 1:失败。
  • 2:UCE场景且无需重建模型优化器。

ctx

可选

回调函数上下文。

默认为空。

表1 回调函数参数

参数

是否必选

说明

取值要求

is_uce_error

-

表示该卡是否发生UCE故障。

  • False:未发生UCE故障。
  • True:发生UCE故障。

args

-

tft_set_step_args设置的参数。

由注册方决定。

ctx

-

回调函数上下文。

由注册方决定。

返回值

无返回值,出错会打印ERROR日志、抛出异常。