集群调度并未专门为用户提供弹性训练的YAML示例,用户可以获取断点续训的YAML并进行修改即可使用。
表1 获取YAML任务类型
|
模型
|
YAML文件名称
|
获取链接
|
说明
|
Volcano Job
|
Resnet50
|
a800_tensorflow_vcjob.yaml
|
获取YAML
|
示例默认为单机8卡任务
|
a800_pytorch_vcjob.yaml
|
获取YAML
|
a800_vcjob.yaml(MindSpore架构)
|
获取YAML
|
示例默认为单机单卡任务
|
盘古
|
a800_vcjob.yaml(MindSpore架构)
|
获取YAML
|
示例默认为2*8卡任务
|