PyTorch场景如何采集最小膨胀数据

故障现象

模型运行过程中开启Profiling采集性能数据会造成性能膨胀,具体表现是开启Profiling后模型性能数据采集step打屏耗时较不开启Profiling耗时变长,两者差值为膨胀时间。

故障原因

膨胀程度与Profiling采集设置相关,以下按影响模型性能程度列举主要影响因素:

  1. with_stack开关:开启with_stack会获取模型调用栈信息(性能影响巨大,可使用影响较小的with_modules替代)。
  2. profiler_level:profiler_level设置级别越高,采集数据量越大,同时造成的性能膨胀也更大。
  3. activities设置:采集事件类型。
  4. 其余采集开关。

故障处理