昇腾社区首页
中文
注册
开发者
下载

torch_npu.profiler._KinetoProfile

产品支持情况

产品 是否支持
[object Object]Atlas A3 训练系列产品[object Object]
[object Object]Atlas A2 训练系列产品[object Object]
[object Object]Atlas 训练系列产品[object Object]

功能说明

提供PyTorch训练过程中的性能数据采集功能。

函数原型

[object Object]

参数说明

  • activities (enum):可选参数,CPU、NPU事件采集列表。可取值以及含义详见

  • record_shapes (bool):可选参数,算子的InputShapes和InputTypes。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • profile_memory (bool):可选参数,算子的内存占用情况。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    说明:[object Object] 已知在安装有glibc<2.34的环境上采集memory数据,可能触发glibc的一个已知,通过升级环境的glibc版本可解决此问题。

  • with_stack (bool):可选参数,算子调用栈。包括框架层及CPU算子层的调用信息。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • with_flops (bool):可选参数,算子浮点操作(该参数暂不支持解析性能数据)。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • experimental_config:可选参数,扩展参数,通过扩展配置性能分析工具常用的采集项。支持采集项和详细介绍请参见

返回值说明

调用示例

以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。

[object Object]