昇腾社区首页
中文
注册

采集MC2算子的性能数据

展示如何使用msProf工具来上板调优一个MC2算子,并生成通算流水图。

前提条件

  • 完成MC2算子的开发。
  • 参考使用前准备完成相关环境变量配置。

操作步骤

本示例以Ascend CL单算子调用为例,其他调用场景请参见Ascend C算子开发指南

  1. 请参考算子编译部署,完成算子的编译部署。
    1. 在算子编译文件op_kernel目录下的CMakeLists.txt中引入以下编译选项,使能MC2算子的AIC打点和代码行映射功能。
      add_ops_compile_options(ALL OPTIONS -DASCENDC_TIME_STAMP_ON, -g)
    2. 进入自定义算子工程目录下编译部署算子。
      ./build_out/custom_opp_<target_os>_<target_architecture>.run
  2. 使用msProf采集MC2算子的性能数据。
    msprof op --output=$HOME/projects/output $HOME/projects/MyApp blockdim 1 // --output为可选参数,$HOME/projects/MyApp为使用的app,blockdim 1为用户app的可选参数 
  3. 界面生成以下目录结构和性能数据文件,具体请参见msprof op章节。
  4. 将trace.json或visualize_data.bin文件导入MindStudio Insight工具进行可视化呈现,具体请参见计算内存热力图通算流水图Roofline瓶颈分析图