展示如何使用msProf工具来上板调优一个MC2算子,并生成通算流水图。
前提条件
- 完成MC2算子的开发。
- 参考使用前准备完成相关环境变量配置。
操作步骤
本示例以Ascend CL单算子调用为例,其他调用场景请参见《Ascend C算子开发指南》。
- 请参考算子编译部署,完成算子的编译部署。
- 在算子编译文件op_kernel目录下的CMakeLists.txt中引入以下编译选项,使能MC2算子的AIC打点和代码行映射功能。
add_ops_compile_options(ALL OPTIONS -DASCENDC_TIME_STAMP_ON, -g)
- 进入自定义算子工程目录下编译部署算子。
bash build.sh
./build_out/${custom_opp_*.run} // {}为当前目录下run包的名称
- 使用msProf采集MC2算子的性能数据。
msprof op --application=./output/{exe}
- 界面生成以下目录结构和性能数据文件,具体请参见msprof op章节。
- 将mc2_trace.json或visualize_data.bin文件导入MindStudio Insight工具进行可视化呈现,具体请参见计算内存热力图、通算流水图(MC2算子)和Roofline瓶颈分析图。