简介

性能分析工具用于采集和分析运行在昇腾AI处理器上的AI任务各个运行阶段的关键性能指标, 用户可根据输出的性能数据,快速定位软、硬件性能瓶颈,提升AI任务性能分析的效率。

  • 本文提供了多种性能数据采集方式,从便捷性角度考虑,推理场景推荐使用msprof命令行工具方式采集,训练场景推荐直接在AI框架内修改接口参数采集。
  • 如果当前环境未安装Ascend-cann-toolkit开发套件包,则无法使用msprof命令行工具。

以下场景对应的全流程采集、解析以及性能数据分析请参见离线推理场景性能分析PyTorch训练/在线推理场景性能分析TensorFlow训练/在线推理场景性能分析

图1 性能分析总体流程