昇腾社区首页
中文
注册

通算流水图(MC2算子)

MC2算子是一种多卡并行的通算融合算子,由一对aicpu和aicore算子组成,以aicpu为名的通道负责通信任务,以数字为名的通道负责aicore的计算任务,数字代表blockID。

可使用msprof op对MC2算子进行调优,并生成mc2_trace.json和visualize_data.bin文件,将mc2_trace.json文件或visualize_data.bin文件导入MindStudio Insight后进行可视化呈现,开发者能够直观看到算子的通算运行情况。界面支持查看算子的通算运行情况、指令耗时情况等功能,协助开发者识别通算瓶颈。

  • 若要使用MindStudio Insight进行查看时,需要单独安装MindStudio Insight软件包,具体下载链接请参见安装与卸载
  • 将visualize_data.bin文件导入MindStudio Insight的具体操作请参考导入性能数据
  • MindStudio Insight具体操作请参见时间线(Timeline)
图1 通算流水图
  • 在界面顶部,可切换计算单元和核函数文件。
  • 在左侧界面,提供算子核函数各行代码对应的耗时及对应的指令数,帮助开发者快速定位瓶颈代码行。
  • 在右侧界面,提供具体的指令耗时与执行次数及与代码相关联,帮助开发者进一步分析代码耗时长的原因。
  • 流水图会展示aicore上各个block的计算阶段,开发者能够清晰感知到算子运行过程中aicore上的指令运行情况,单击该指令还会看到指令耗时及对应的代码行细节。