昇腾社区首页
中文
注册

算子上板调优

算子调优工具支持上板环境下的性能数据采集和自动解析。
表1 参数说明

启用参数

可选参数

描述

是否必选

op

说明:
  • 开启算子上板调优。使用msprof op 可选参数 ./app [arguments]格式进行调用。
  • msprof工具的使用依赖CANN包中的msopprof可执行文件,该文件中的接口使用和msprof op一致,该文件为CANN包自带,无需单独安装。

--application

说明:

当前与./app [arguments]兼容,后期将修改为./app [arguments]。

建议使用msprof op ./app [arguments]进行拉取,其中app为指定的可执行文件,如果app未指定路径,默认为使用当前路径,[arguments]为app的参数。

是,指定的可执行文件和--config二选一

--config

配置为输入算子二进制文件*.o的json文件,可配置为绝对路径或者相对路径

具体可参考json配置文件说明

--kernel-name

指定要采集的算子名称,如果不指定,则只对程序运行过程中调度的第一个算子进行采集。

需与--application配合使用,限制长度为1024,仅支持A-Za-z0-9_中的一个或多个字符。

--aic-metrics

使能算子性能指标采集。支持以下性能指标采集项,默认全部采集。
  • ArithmeticUtilization
  • L2Cache
  • Memory
  • MemoryL0
  • MemoryUB
  • PipeUtilization
  • ResourceConflictRatio

可选其中的一项或多项,选多项时用英文逗号隔开,例如:--aic-metrics=Memory,MemoryL0

说明:

若仅采集部分性能指标,可能会影响visualize_data.bin的可视化呈现结果。

--output

收集到的性能数据的存放路径,默认在当前目录下保存性能数据。

--help

输出帮助信息。

算子上板调优可以通过以下两种方式执行:
  • 基于可执行文件
    示例一:
    msprof op ./add_custom_npu
    示例二:
    msprof op --aic-metrics=<select_metrics> --output=./output_data ./add_custom_npu 
  • 基于输入算子二进制文件*.o的配置文件.json
    msprof op --config=./add_test.json --aic-metrics=<select_metrics> --output=./output_data
命令完成后,会在默认路径或指定的“--output”目录下生成以“OPPROF_{timestamp}_XXX”命名的文件夹,在“--aic-metrics”全部开启时,结构示例如下:
OPPROF_{timestamp}_XXX
├── dump
   ├── DeviceProf1.bin   
   ├── DeviceProf2.bin
   ├── DeviceProf3.bin
   ├── DeviceProf4.bin
   ├── DeviceProf5.bin
   ├── DeviceProf6.bin
   ├── duration.bin
   └── op_basic_info.txt
├── ArithmeticUtilization.csv
├── L2Cache.csv
├── Memory.csv
├── MemoryL0.csv
├── MemoryUB.csv
├── OpBasicInfo.csv
├── PipeUtilization.csv
└── ResourceConflictRatio.csv
├── visualize_data.bin