mindx_elastic.terminating_message.ExceptionCheckpoint(prefix='CKP', directory=None, config=None, partial_save=False, replicas=1)
功能说明
在训练每一轮或者每一次迭代执行的固定动作,用于捕捉INT和TERM信号,触发临终checkpoint的保存。
参数:
- prefix(str)- checkpoint文件的前缀名称。
- directory(str)- 保存checkpoint文件的文件夹路径。默认情况下,文件保存在当前目录下。
- config(CheckpointConfig)- checkpoint策略配置。
- partial_save(bool)- 是否开启部分保存。
- replicas(int)- 部分保存的副本数量,最小值1,最大值5。