通算流水图
通过msprof op对通算融合算子进行调优后,生成的trace.json和visualize_data.bin文件可通过MindStudio Insight进行可视化呈现,能够直观看到通算运行情况、指令耗时等信息,协助开发者识别通算瓶颈。当前仅支持MC2和LCCL类型的通算融合算子。

- Chrome浏览器
在Chrome浏览器中输入“chrome://tracing”地址,并将通过msprof op生成的通算流水图文件(trace.json)拖到空白处打开,键盘上输入快捷键(W:放大,S:缩小,A:左移,D:右移)可进行查看。关键字段说明如表1。
表1 关键字段说明 字段名
字段功能
MC2算子
LCCL算子
AI CORE
算子在AI Core上的整体运行情况。
支持
支持
AI CPU
算子在AI CPU上的整体运行情况。
支持
不支持
TURN
算子在AI CPU上不同通信轮次的流水。
支持
不支持
AIC BLOCK
算子在AI Core各cube核上的整体运行情况和关键接口调用情况。
支持
支持
AIV BLOCK
算子在AI Core各vector核上的整体运行情况和关键接口调用情况。
支持
支持
HCCL
通过HCCL通信的算子在多卡间的集合通信流水。
支持
不支持
HCCL TASK
通过HCCL通信的算子在多卡间的集合通信任务执行流水。
支持
不支持
- MindStudio Insight
通过msprof op生成的trace.json文件或visualize_data.bin文件可导入MindStudio Insight进行可视化呈现。图1 通算流水图
- 展示算子在AI CPU和AI Core的耗时掩盖情况,用于评估通算融合算子的性能。
- 展示算子在AI CPU上的不同通信轮次的流水。
- 展示算子在各BLOCK上的运行时间及关键接口调用流水。
- 展示通过HCCL通信的算子在多卡间运行时的集合通信流水及集合通信任务流水。
- MC2算子支持对
Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件 及Atlas A3 训练系列产品/Atlas A3 推理系列产品 的AllReduce、AllGather、ReduceScatter、AlltoAll、AlltoAllV等接口进行调用,具体介绍请参见Hccl中的“高阶API > Hccl > Hccl”章节,添加-g编译选项后,单击具体接口将会关联代码行调用栈。 - MC2算子和LCCL算子的支持情况请参考表1
- MC2算子支持对
父主题: 算子调优(msProf)