用户在ModelArts场景下使用断点续训特性,可以按照以下流程进行操作。
步骤 |
说明 |
操作参考 |
---|---|---|
了解ModelArts场景 |
用户需要提前了解ModelArts场景下,断点续训的相关说明和约束。 |
具体说明请参见ModelArts场景说明。 |
进行脚本适配 |
修改训练涉及到的模型脚本,如Resnet50和Pangu-alpha模型。 |
具体操作请参见脚本适配。 |
准备镜像 |
制作断点续训的故障恢复功能所需镜像和临终遗言功能所需镜像。 |
具体操作请参见镜像制作。 |
启动训练任务 |
在ModelArts平台上启动训练任务。 |
具体操作请参见任务启动流程。 |
查看训练结果 |
查看训练任务是否成功运行。 |
具体操作请参见查看结果。 |