使用场景

msprof工具能够对算子性能数据的进行一键式采集,提升开发者对于算子性能的优化效率。

当前支持基于不同运行模式(上板或仿真)和不同文件形式(可执行文件或算子二进制.o文件)进行性能数据的采集和自动解析。

支持如下调用算子的场景:
  • 通过AscendCL接口调用Ascend C算子,在调试前需额外指定算子动态加载路径,执行如下的命令导入算子信息:
    export LAUNCH_KERNEL_PATH=/{path_to_kernel}/kernel_name.o
  • 基于单算子API执行的方式调用NN类算子的示例代码,可参考《AscendCL应用软件开发指南 (C&C++)》中“单算子调用 > 单算子API执行 > 调用NN类算子接口示例代码”章节。
  • 通过PyTorch框架进行单算子调用的场景,详细信息可参考《Ascend C自定义算子开发指南》中“网络中算子调用 > PyTorch框架”章节。

当前msprof 工具支持的产品型号为

Atlas A2训练系列产品/Atlas 800I A2推理产品