开发者
资源
[object Object][object Object][object Object]undefined
[object Object]

注册Profiler采集回调函数,采集用户子线程下发的torch算子等框架侧数据。该参数中可另外配置的参数(包括record_shapes、profile_memory、with_stack、with_flops、with_modules),作为Profiler子线程的采集配置。

配对使用。

[object Object]
[object Object]
[object Object]
  • record_shapes([object Object]):可选参数,算子的InputShapes和InputTypes。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • profile_memory([object Object]):可选参数,算子的内存占用情况。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    [object Object]
  • with_stack([object Object]):可选参数,算子调用栈。包括框架层及CPU算子层的调用信息。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • with_modules([object Object]):可选参数,modules层级的Python调用栈,即框架层的调用信息。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

  • with_flops([object Object]):可选参数,算子浮点操作(该参数暂不支持解析性能数据)。取值为:

    • True:开启。
    • False:关闭。

    默认值为False。

    开启torch_npu.profiler.ProfilerActivity.CPU时生效。

[object Object]

[object Object]

以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。

[object Object]