展示如何使用msProf工具来上板调优一个vector算子,该vector算子可实现两个向量相加并输出结果的功能。
以Add算子为例,在样例工程的${git_clone_path}/samples/operator/ascendc/0_introduction/3_add_kernellaunch/AddKernelInvocationNeo目录下,执行以下命令,构建可执行文件。
bash run.sh -r npu -v <soc_version> # 运行在昇腾设备上的算子 bash run.sh -r sim -v <soc_version> # 运行在仿真器上的算子
一键式编译运行脚本完成后,在工程目录下生成NPU侧可执行文件ascendc_kernels_bbit。
export LD_LIBRARY_PATH=${git_clone_path}/samples/operator/ascendc/0_introduction/3_add_kernellaunch/AddKernelInvocationNeo/out/lib/:$LD_LIBRARY_PATH
对于运行在昇腾设备上的算子,使用如下命令完成msprof op性能数据和精细化调优数据的采集。
msprof op ascendc_kernels_bbit
对于运行在仿真器上的算子,使用如下命令完成msprof op simulator性能数据、流水图和热点图数据的采集。
msprof op simulator --soc-version=Ascendxxxyy ascendc_kernels_bbit