昇腾社区首页
中文
注册

torch_npu.profiler.profile

函数原型

[object Object]

功能说明

提供PyTorch训练过程中的性能数据采集功能。

参数说明

  • activities:CPU、NPU事件采集列表,Enum类型。可取值以及含义详见undefined

  • schedule:设置不同step的行为,Callable类型。由undefined控制。默认不执行任何操作。

  • on_trace_ready:采集结束时自动执行操作,Callable类型。当前仅支持执行undefined的操作,默认不执行任何操作。

  • record_shapes:算子的InputShapes和InputTypes,Bool类型。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • profile_memory算子的内存占用情况,Bool类型。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    说明:[object Object] 已知在安装有glibc<2.34的环境上采集memory数据,可能触发glibc的一个已知undefined,通过升级环境的glibc版本可解决此问题。

  • with_stack:算子调用栈,Bool类型。包括框架层及CPU算子层的调用信息。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • with_modules:modules层级的Python调用栈,即框架层的调用信息,Bool类型。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • with_flops:算子浮点操作,Bool类型(该参数暂不支持解析性能数据)。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • experimental_config:扩展参数,通过扩展配置性能分析工具常用的采集项。支持采集项和详细介绍请参见undefined

  • use_cuda:昇腾环境不支持。开启采集cuda性能数据开关,Bool类型。取值为:

    • True:开启。
    • False:关闭。默认值。

    torch_npu.profiler._KinetoProfile不支持该参数。

支持的型号

  • [object Object]Atlas 训练系列产品[object Object]
  • [object Object]Atlas A2 训练系列产品[object Object]
  • [object Object]Atlas A3 训练系列产品[object Object]

调用示例

[object Object]