工具简介

msprof性能分析工具用于采集和分析运行在昇腾AI处理器上算子的关键性能指标,用户可根据输出的性能数据,快速定位算子的软、硬件性能瓶颈,提升算子性能分析的效率。

使用场景

当前支持基于不同运行模式(上板或仿真)和不同文件形式(可执行文件或算子二进制.o文件)进行性能数据的采集和自动解析。

支持如下调用算子的场景:

功能特性

msProf命令行工具提供了算子运行性能数据、昇腾AI处理器计算单元数据等性能数据的采集和解析能力,具体请参见表1

表1 msProf工具功能

功能

具体描述

算子上板调优

  • 算子性能数据block级采集(提供每个核的数据)。
  • 采集七类性能指标数据,包括ArithmeticUtilization、PipeUtilization、Memory、MemoryL0、MemoryUB、ResourceConflictRatio以及L2Cache等。

算子仿真调优

  • 生成并展示仿真性能数据流水图。
  • 查看仿真性能数据代码行和指令耗时。
  • 支持仿真性能数据指令与代码行映射。
  • 生成热点图。

通过键盘输入“CTRL+C”后,算子执行将会被停止,工具会根据当前已有信息生成性能数据文件。若不需要生成该文件,可再次键盘输入“CTRL+C”指令。