torch_npu.profiler.schedule
产品支持情况
| 产品 | 是否支持 |
|---|---|
| [object Object]Atlas A3 训练系列产品[object Object] | √ |
| [object Object]Atlas A2 训练系列产品[object Object] | √ |
| [object Object]Atlas 训练系列产品[object Object] | √ |
功能说明
设置不同step的行为。用于构造torch_npu.profiler.profile的schedule参数。默认不执行schedule操作。
函数原型
[object Object]
参数说明
wait (
int):必选参数,每次重复执行采集跳过的step轮数。active (
int):必选参数,采集的step轮数。warmup (
int):可选参数,预热的step轮数。默认值为0。建议设置1轮预热。repeat (
int):可选参数,重复执行wait+warmup+active的次数。默认值为0,表示重复执行repeat不停止,建议配置为大于0的整数。当使用集群分析工具或MindStudio Insight查看时,建议配置repeat = 1(表示执行1次,仅生成一份性能数据),因为:
- repeat > 1会在同一目录下生成多份性能数据,则需要手动将采集的性能数据文件夹分为repeat等份,放到不同文件夹下重新解析,分类方式按照文件夹名称中的时间戳先后。
- repeat = 0表示重复执行的具体次数由总训练步数确定,例如总训练步数为100,wait + active + warmup = 10,skip_first = 10,则repeat = ( 100 - 10 ) / 10 = 9,表示重复执行9次,生成9份性能数据。
skip_first (
int):可选参数,采集前先跳过的step轮数。默认值为0。动态Shape场景建议跳过前10轮保证性能数据稳定;对于其他场景,可以根据实际情况自行配置。
返回值说明
无
调用示例
以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。
[object Object]