展示如何使用msProf工具来上板调优一个vector算子,该vector算子可实现两个向量相加并输出结果的功能。
以Add算子为例,可执行文件的构建命令示例如下:
bash run.sh -r npu -v <soc_version> # 运行在昇腾设备上的算子 bash run.sh -r sim -v <soc_version> # 运行在仿真器上的算子
一键式编译运行脚本完成后,在工程目录下生成NPU侧可执行文件ascendc_kernels_bbit。
对于运行在昇腾设备上的算子,使用如下命令完成工具使用。性能数据和精细化调优数据采集。
msprof op ascendc_kernels_bbit
对于运行在仿真器上的算子,使用如下命令完成工具使用。 性能数据、流水图和热点图数据采集。
msprof op simulator ascendc_kernels_bbit