性能分析
执行Profiling采集
Profiling数据分析方法
- 全量迭代耗时数据:在Timeline视图下查看Step Trace数据迭代耗时情况,识别耗时较长迭代进行分析。
- 导出对应迭代Timeline数据:单击耗时较长迭代
按钮弹出对话框,单击“Yes”导出对应迭代Timeline数据。如图5所示。
- 查看迭代内耗时情况:存在较长耗时算子时,可以进一步找算子详细信息辅助定位;存在通信耗时或调度间隙较长时,分析调用过程中接口耗时。如图6所示。
- 查看对应的算子统计表:查看迭代内每个AICORE和AICPU算子的耗时及详细信息,进一步定位分析算子的Metrics指标数据,分析算子数据搬运、执行流水的占比情况,识别算子瓶颈点。如图7所示。
- 查看组件接口耗时统计表:查看迭代内AscendCL API和Runtime API的接口耗时情况,辅助分析接口调用对性能的影响。如图8所示。
父主题: 推理一体化工具