昇腾社区首页
中文
注册
开发者
下载

torch_npu.profiler.schedule

产品支持情况

产品 是否支持
[object Object]Atlas A3 训练系列产品[object Object]
[object Object]Atlas A2 训练系列产品[object Object]
[object Object]Atlas 训练系列产品[object Object]

功能说明

设置不同step的行为。用于构造torch_npu.profiler.profile的schedule参数。默认不执行schedule操作。

函数原型

[object Object]

参数说明

  • wait (int):必选参数,每次重复执行采集跳过的step轮数。

  • active (int):必选参数,采集的step轮数。

  • warmup (int):可选参数,预热的step轮数。默认值为0。建议设置1轮预热。

  • repeat (int):可选参数,重复执行wait+warmup+active的次数。默认值为0,表示重复执行repeat不停止,建议配置为大于0的整数。

    当使用集群分析工具或MindStudio Insight查看时,建议配置repeat = 1(表示执行1次,仅生成一份性能数据),因为:

    • repeat > 1会在同一目录下生成多份性能数据,则需要手动将采集的性能数据文件夹分为repeat等份,放到不同文件夹下重新解析,分类方式按照文件夹名称中的时间戳先后。
    • repeat = 0表示重复执行的具体次数由总训练步数确定,例如总训练步数为100,wait + active + warmup = 10,skip_first = 10,则repeat = ( 100 - 10 ) / 10 = 9,表示重复执行9次,生成9份性能数据。
  • skip_first (int):可选参数,采集前先跳过的step轮数。默认值为0。动态Shape场景建议跳过前10轮保证性能数据稳定;对于其他场景,可以根据实际情况自行配置。

返回值说明

调用示例

以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。

[object Object]