采集MC2算子的性能数据
展示如何使用msProf工具来上板调优一个MC2算子,并生成通算流水图。
前提条件
- 完成MC2算子的开发。
- 参考使用前准备完成相关环境变量配置。
操作步骤
本示例以Ascend CL单算子调用为例,其他调用场景请参见《Ascend C算子开发指南》。
- 请参考算子编译部署,完成算子的编译部署。
- 在算子编译文件op_kernel目录下的CMakeLists.txt中引入以下编译选项,使能MC2算子的AIC打点和代码行映射功能。
add_ops_compile_options(ALL OPTIONS -DASCENDC_TIME_STAMP_ON, -g)
- 进入自定义算子工程目录下编译部署算子。
./build_out/custom_opp_<target_os>_<target_architecture>.run
- 在算子编译文件op_kernel目录下的CMakeLists.txt中引入以下编译选项,使能MC2算子的AIC打点和代码行映射功能。
- 使用msProf采集MC2算子的性能数据。
msprof op --output=$HOME/projects/output $HOME/projects/MyApp blockdim 1 // --output为可选参数,$HOME/projects/MyApp为使用的app,blockdim 1为用户app的可选参数
- 界面生成以下目录结构和性能数据文件,具体请参见msprof op章节。
- 将trace.json或visualize_data.bin文件导入MindStudio Insight工具进行可视化呈现,具体请参见计算内存热力图、通算流水图和Roofline瓶颈分析图。
父主题: 典型案例