昇腾社区首页
中文
注册

register_checker接口

接口功能

注册异步回调函数。

接口格式

mindio_acp.register_checker(callback, check_dict, user_context, timeout_sec)

接口参数

参数

是否必选

说明

取值要求

callback

必选

回调函数(第一个参数result为数据完整性校验的结果,0为成功,其他为失败;第二个参数为user_context)。

有效函数名。

check_dict

必选

数据完整性校验条件,类型dict,用来校验指定path下的文件个数是否符合要求。

  • key:path,数据路径。
  • value:对应key路径下的文件个数。

user_context

必选

回调函数的第二个参数。

-

timeout_sec

必选

回调超时时间,单位:秒。

说明:

如果训练客户端日志中提示:"watching checkpoint failed",则需要调大该参数。

代码在mindio_acp实际安装路径(“mindio_acp/acc_checkpoint/framework_acp.py”)下的async_write_tracker_file函数中。

[1, 3600]

使用样例

>>> def callback(result, user_context):
>>>    if result == 0:
>>>        print("success")
>>>    else:
>>>        print("fail")
>>> context_obj = None
>>> check_dict = {'/mnt/dpc01/checkpoint-last': 4}
>>> mindio_acp.register_checker(callback, check_dict, context_obj, 1000)

返回值

  • None:失败。
  • 1:成功。