MindStudio执行模型训练的主要步骤包括:创建训练工程(首次执行训练)/导入训练工程(已存在训练工程)>运行配置>执行训练。
当前支持以MindSpore、TensorFlow和PyTorch训练框架为模板创建训练工程。
当选择“Templates”下的工程时,需要导入或自行编写训练脚本,若为NPU训练脚本,可直接进行模型训练;若为GPU训练脚本,需要将脚本通过分析迁移转换为NPU训练脚本,再进行模型训练;当选择“Samples”下的NPU训练工程样例时,可直接进行模型训练。
参数 |
说明 |
---|---|
Project name |
工程名称,自行配置。 名称开头和结尾必须是数字或字母。只能包含字母、数字、中划线和下划线,且长度不超过64个字符。 |
Project location |
工程默认保存路径,用户可自定义。(对于首次使用MindStudio的用户,该项默认为“$HOME/MindstudioProjects”。) |
More settings |
“Module name”:模块名,默认与“Project name”一致。 |
“Content root”:根目录下路径。 |
|
“Module file location”:模块文件路径。 |
|
单击“Project format”右侧选框,出现下拉菜单。
|
├── .idea ├── data //数据集目录,需用自行创建 ├── .project //工程信息文件,包含工程类型、工程描述、运行目标设备类型以及CANN版本 ├── train.py //训练脚本文件,为空文件,用户在这里编写训练脚本 ├── MyTraining.iml
如果已有训练工程,则无需新建训练工程,可直接通过MindStudio导入,操作如下。
在右侧配置训练工程运行信息,配置示例如表2所示。
参数 |
说明 |
备注 |
---|---|---|
Name |
工程名称,用户自行配置。 例如:MyTraining |
名称必须以字母开头,数字或字母结尾,只能包含字母、数字、中划线和下划线,且长度不能超过64个字符。 |
Run Mode |
运行环境选择。选择“Remote Run”或“Local Run”,默认为“Remote Run”。 |
- |
Executable |
训练工程中的执行入口文件。 例如: /data/home/xxx/MindstudioProjects/MyTraining/train.py |
- |
Deployment |
运行配置。选择Remote Run模式时可见,必选配置。 |
通过Deployment功能,详细请参见Deployment,可以将指定项目中的文件、文件夹同步到远程指定机器的指定目录。 |
Command Arguments |
训练工程执行参数,可选配置。 |
- |
Environment Variables |
训练工程环境变量,可选配置。 |
- |
此整网支持度报告是以MindSpore训练框架创建的训练工程,训练失败后在工程根目录下的out/reports下生成的.report文件;以TensorFlow和PyTorch训练框架创建的训练工程,训练失败后生成的.report文件返回至用户自定义的输出路径。