提供PyTorch训练过程中的性能数据采集功能。
[object Object]
record_shapes (
[object Object]):可选参数,算子的InputShapes和InputTypes。取值为:- True:开启。
- False:关闭。
默认值为False。
开启torch_npu.profiler.ProfilerActivity.CPU时生效。
profile_memory (
[object Object]):可选参数,算子的内存占用情况。取值为:- True:开启。
- False:关闭。
默认值为False。
[object Object]
with_stack (
[object Object]):可选参数,算子调用栈。包括框架层及CPU算子层的调用信息。取值为:- True:开启。
- False:关闭。
默认值为False。
开启torch_npu.profiler.ProfilerActivity.CPU时生效。
with_flops (
[object Object]):可选参数,算子浮点操作(该参数暂不支持解析性能数据)。取值为:- True:开启。
- False:关闭。
默认值为False。
开启torch_npu.profiler.ProfilerActivity.CPU时生效。
experimental_config:可选参数,扩展参数,通过扩展配置性能分析工具常用的采集项。支持采集项和详细介绍请参见。
无
以下是关键步骤的代码示例,不可直接拷贝编译运行,仅供参考。
[object Object]