昇腾社区首页
中文
注册

mindx_elastic.terminating_message.ExceptionCheckpoint(prefix='CKP', directory=None, config=None, partial_save=False, replicas=1)

功能说明

在训练每一轮或者每一次迭代执行的固定动作,用于捕捉INT和TERM信号,触发临终checkpoint的保存。

参数:

  • prefix(str)- checkpoint文件的前缀名称。
  • directory(str)- 保存checkpoint文件的文件夹路径。默认情况下,文件保存在当前目录下。
  • config(CheckpointConfig)- checkpoint策略配置。
  • partial_save(bool)- 是否开启部分保存。
  • replicas(int)- 部分保存的副本数量,最小值1,最大值5。