使用前准备
工具路径
msprof工具安装在Ascend-cann-toolkit开发套件包中,工具保存路径为${INSTALL_DIR}/tools/profiler/bin。

- ${INSTALL_DIR}请替换为CANN软件安装后文件存储路径。例如,若安装的Ascend-cann-toolkit软件包,则安装后文件存储路径为:$HOME/Ascend/ascend-toolkit/latest。
- 若完成了环境准备章节中的环境变量配置,可无需切换目录直接执行msprof命令。
环境准备
- 算子代码的编译选项需添加 -g -O2。
- 编辑算子工程op_kernel目录下的CMakeLists.txt文件,可参考创建算子工程。
add_ops_compile_options(ALL OPTIONS -g -O2)
- 编辑样例工程目录下的“cmake/npu/CMakeLists.txt”文件,单击LINK参考核函数开发和运行验证的完整样例。
target_compile_options(${smoke_testcase}_npu PRIVATE -O2 -g -std=c++17 )
- 编辑算子工程op_kernel目录下的CMakeLists.txt文件,可参考创建算子工程。
- 进行算子上板或者仿真调优之前,需要获取NPC侧可执行文件或算子二进制.o文件。
- 可参考《Ascend C自定义算子开发指南》中的“核函数运行验证”章节,完成npu模式下(又分为npu_simulator仿真或npu_onboard上板)的一键式编译运行,并获取NPU侧可执行文件<kernel_name>_npu。
- 可参考算子编译部署,对算子kernel侧实现进行编译,并获取算子二进制文件*.o。
- 由于仿真器不支持多设备,如果调用算子的应用程序main.cpp或其他代码文件中配置使用了设备号deviceid,需要修改为0。
- 使用msprof工具进行算子仿真调优之前,需执行如下命令配置环境变量。
export LD_LIBRARY_PATH=$HOME/Ascend/ascend-toolkit/latest/tools/simulator/Ascendxxxyy/lib:$LD_LIBRARY_PATH
请根据CANN软件包实际安装路径和昇腾AI处理器的型号对以上环境变量进行修改。
权限约束
- 用户须自行保证使用最小权限原则(如禁止other用户可写,常见如禁止666、777)。
- 使用性能分析工具前请确保执行用户的umask值大于等于0027,否则会导致获取的性能数据所在目录和文件权限过大。
- 若要查看umask的值,则执行命令:umask
- 若要修改umask的值,则执行命令:umask 新的取值
- 请确保性能数据保存在不含软链接的当前用户目录下,否则可能引起安全问题。
执行约束
- 工具需要配套Python版本使用,本功能要求Python3.7及以上版本。
- 不支持在同一个Device侧同时拉起多个性能采集任务。
- 性能数据采集时间建议在5min以内,同时推荐用户设置的内存大小在20G以上(例如容器配置:docker run --memory=20g 容器名)。
- 生成的dump数据文件小于500B或大于1GB时,工具将不支持自动解析。
父主题: msprof工具