昇腾社区首页
中文
注册
开发者
下载

快速入门

环境准备

本快速入门以在Atlas 800T A2 训练服务器上运行为例。

  • 驱动和固件、CANN软件安装请参考《》(商用版)或《》(社区版):

    • 安装方式:选择“在物理机上安装”
    • 安装类型:选择“离线安装”
    • 操作系统:选择可用的操作系统(兼容性请参考
  • 安装PyTorch框架及torch_npu插件请参见《》。

模型迁移训练

本节提供了一个简单的模型迁移样例,采用了最简单的自动迁移方法,帮助用户快速体验GPU模型脚本迁移到昇腾NPU上的流程。基于CNN模型识别手写数字的脚本,对在GPU上训练的该脚本代码进行修改,使其可以迁移到昇腾NPU上进行训练。

  1. 新建脚本train.py,写入以下原GPU脚本代码。

    [object Object]
  2. 在train.py中添加以下代码。

    • 若用户使用[object Object]Atlas 训练系列产品[object Object],则在迁移完成、训练开始之前,由于其架构特性需要,用户需要开启混合精度。
    • 若用户使用[object Object]Atlas A2 训练系列产品[object Object]或[object Object]Atlas A3 训练系列产品[object Object],则可以自行选择是否开启混合精度。
    [object Object]
    [object Object]

    若未使能自动迁移,用户可参考《PyTorch 训练模型迁移调优指南》中的“”章节进行相关操作。

  3. 使能AMP混合精度计算。若用户使用[object Object]Atlas A2 训练系列产品[object Object]或[object Object]Atlas A3 训练系列产品[object Object],则可以选择跳过此步骤。

    在模型、优化器定义之后,定义AMP功能中的GradScaler。

    [object Object]

    删除以下原GPU脚本代码。

    [object Object]

    添加以下代码开启AMP。

    [object Object]
  4. 执行命令启动训练脚本(命令脚本名称可根据实际修改)。

    [object Object]

    训练结束后生成如下图权重文件,则说明迁移训练成功。

进阶开发

  • 如果您想体验PyTorch模型训练迁移更丰富的功能,请前往《》文档阅读了解。

  • 如果您想体验大模型训练更丰富的功能,请参见了解。

    表 1 模型迁移指导[object Object][object Object]

    [object Object]undefined