创建训练作业
对于PyTorch模型,训练作业创建步骤如下:
- 登录ModelArts管理控制台,在左侧导航栏中选择“训练管理” > “训练作业” ,进入训练作业界面,如图1所示。
- 如图1所示,单击“创建训练作业”按钮,按照顺序填写以下信息,完成后单击“提交”。
- 训练作业基本信息:名称,描述,实验设置,如图2所示。
- 设置环境信息:如图3所示。
表1 环境信息示例参数说明表 参数信息
说明
创建方式
创建方式选择 “自定义算法”。
启动方式
启动方式选择“自定义”。
镜像
镜像选择创建算法中上传好的镜像。
启动命令
启动命令填写:python ./modelarts/train_start.py。
工作目录
选择对应工作目录。
- 设置参数信息:如图4所示。
表2 参数信息示例参数说明表 参数信息
说明
data_url
训练数据集的obs地址。
test_data_url
测试数据集的obs地址。
train_url
训练输出obs地址。
- 资源设置:根据需要选择资源池、资源类型、规格与计算节点个数,设置作业日志路径,如图5所示。