ModelArts场景

用户在ModelArts场景下使用断点续训特性,可以按照以下流程进行操作。

图1 断点续训使用流程图

流程介绍

表1 使用流程说明

步骤

说明

操作参考

了解ModelArts场景

用户需要提前了解ModelArts场景下,断点续训的相关说明和约束。

具体说明请参见ModelArts场景说明

进行脚本适配

修改训练涉及到的模型脚本,如Resnet50和Pangu-alpha模型。

具体操作请参见脚本适配

准备镜像

制作断点续训的故障恢复功能所需镜像和临终遗言功能所需镜像。

具体操作请参见镜像制作

启动训练任务

在ModelArts平台上启动训练任务。

具体操作请参见任务启动流程

查看训练结果

查看训练任务是否成功运行。

具体操作请参见查看结果