类型
配置
服务器
Atlas 800 训练服务器(型号:9000/9010)
训练框架
MindSpore/TensorFlow/PyTorch,其中断点续训特性中的临终遗言功能只支持MindSpore框架
计算公式:两次心跳上报间隔的阈值 = 心跳发送间隔配置 x 3,其中3表示Volcano会重试3次。