当前,不支持设置ASCEND_RT_VISIBLE_DEVICES环境变量后,使用msProf工具。
参数 |
描述 |
是否必选 |
---|---|---|
op |
开启算子调优。 说明:
msprof工具的使用依赖CANN包中的msopprof可执行文件,该文件中的接口使用和msprof op一致,该文件为CANN包自带,无需单独安装。 |
是 |
--application |
配置为运行环境上的指定可执行文件,可配置为绝对路径或者相对路径。 说明:
不建议配置其他用户目录或其他用户可写目录下的AI任务,避免提权风险。 不建议配置删除文件或目录、修改密码、提权命令等有安全风险的高危操作。 |
是,二选一 |
--config |
配置为算子编译得到的二进制文件*.o,可配置为绝对路径或者相对路径。 具体可参考msprof json配置文件说明。 |
|
--kernel-name |
指定要采集的算子名称,如果不指定,则只对程序运行过程中调度的第一个算子进行采集。 需与--application配合使用,限制长度为1024,仅支持A-Za-z0-9_中的一个或多个字符。 |
否 |
--aic-metrics |
使能算子性能指标采集。支持以下性能指标采集项,默认全部采集。
可选其中的一项或多项,选多项时用英文逗号隔开,例如:--aic-metrics=Memory,MemoryL0。 说明:
若仅采集部分性能指标,会影响visualize_data.bin的可视化数据的正确性。 |
否 |
--output |
收集到的性能数据的存放路径,默认在当前目录下保存性能数据。 |
否 |
--help |
输出帮助信息。 |
否 |
msprof op --application=./add_custom_npu --aic-metrics=<select_metrics> --output=./output_data
msprof op --config=./add_test.json --aic-metrics=<select_metrics> --output=./output_data
OPPROF_{timestamp}_XXX ├── dump ├── ArithmeticUtilization.csv ├── L2Cache.csv ├── Memory.csv ├── MemoryL0.csv ├── MemoryUB.csv ├── OpBasicInfo.csv ├── PipeUtilization.csv └── ResourceConflictRatio.csv