采集MC2算子的性能数据

展示如何使用msProf工具来上板调优一个MC2算子,并生成通算流水图。

前提条件

操作步骤

本示例以Ascend CL单算子调用为例,其他调用场景请参见Ascend C算子开发指南

  1. 请参考算子编译部署,完成算子的编译部署。

    1. 在算子编译文件op_kernel目录下的CMakeLists.txt中引入以下编译选项,使能MC2算子的AIC打点和代码行映射功能。
      add_ops_compile_options(ALL OPTIONS -DASCENDC_TIME_STAMP_ON, -g)
    2. 进入自定义算子工程目录下编译部署算子。
      bash build.sh
      ./build_out/${custom_opp_*.run}   // {}为当前目录下run包的名称

  2. 使用msProf采集MC2算子的性能数据。

    msprof op --application=./output/{exe}

  3. 界面生成以下目录结构和性能数据文件,具体请参见msprof op章节。
  4. 将mc2_trace.json或visualize_data.bin文件导入MindStudio Insight工具进行可视化呈现,具体请参见计算内存热力图通算流水图(MC2算子)Roofline瓶颈分析图