register_checker接口
接口功能
注册异步回调函数。
接口格式
torch_mindio.register_checker(callback, check_dict, user_context, timeout_sec)
接口参数
参数  | 
是否必选  | 
说明  | 
取值要求  | 
|---|---|---|---|
callback  | 
必选  | 
回调函数(第一个参数result为数据完整性校验的结果,0为成功,其他为失败;第二个参数为user_context)。  | 
有效函数名。  | 
check_dict  | 
必选  | 
数据完整性校验条件,类型dict,用来校验指定path下的文件个数是否符合要求。  | 
  | 
user_context  | 
必选  | 
回调函数的第二个参数。  | 
-  | 
timeout_sec  | 
必选  | 
回调超时时间,单位:秒。  说明:  
如果训练客户端日志中提示:"watching checkpoint failed",则需要调大该参数。 代码在torch_mindio实际安装路径(“torch_mindio/acc_checkpoint/framework_acp.py”)下的async_write_tracker_file函数中。  | 
[1, 3600]  | 
使用样例
>>> def callback(result, user_context):
>>>    if result == 0:
>>>        print("success")
>>>    else:
>>>        print("fail")
>>> context_obj = None
>>> check_dict = {'/mnt/dpc01/checkpoint-last': 4}
>>> torch_mindio.register_checker(callback, check_dict, context_obj, 1000)
返回值
- None:失败。
 - 1:成功。
 
父主题: Torch