通算流水图(MC2算子)
MC2算子是一种多卡并行的通算融合算子,由一对aicpu和aicore算子组成,以aicpu为名的通道负责通信任务,以数字为名的通道负责aicore的计算任务,数字代表blockID。
可使用msprof op对MC2算子进行调优,并生成mc2_trace.json和visualize_data.bin文件,将mc2_trace.json文件或visualize_data.bin文件导入MindStudio Insight后进行可视化呈现,开发者能够直观看到算子的通算运行情况。界面支持查看算子的通算运行情况、指令耗时情况等功能,协助开发者识别通算瓶颈。

图1 通算流水图

- 在界面顶部,可切换计算单元和核函数文件。
- 在左侧界面,提供算子核函数各行代码对应的耗时及对应的指令数,帮助开发者快速定位瓶颈代码行。
- 在右侧界面,提供具体的指令耗时与执行次数及与代码相关联,帮助开发者进一步分析代码耗时长的原因。
- 流水图会展示aicore上各个block的计算阶段,开发者能够清晰感知到算子运行过程中aicore上的指令运行情况,单击该指令还会看到指令耗时及对应的代码行细节。
父主题: 算子调优(msProf)