AI Core和AI Vector的带宽和延时数据
Atlas 200/300/500 推理产品:不支持
Atlas 200I/500 A2推理产品:不支持
Atlas 推理系列产品:不支持
Atlas 训练系列产品:不支持
该数据可以从以下入口查看:
- mindstudio_profiler_output/msprof_*.json中的biu_group、aic_core_group、aiv_core_group层级
- timeline/instr_*.json
该数据在Chrome浏览器中展示示例如下:
图1 biu_group

图2 aic_core_group

图3 aiv_core_group

关键字段说明如下。
字段名 |
字段含义 |
---|---|
Bandwidth Read |
BIU单元读取指令时的带宽。 |
Bandwidth Write |
BIU单元写入指令时的带宽。 |
Latency Read |
BIU单元读取指令时的时延。 |
Latency Write |
BIU单元写入指令时的时延。 |
Cube |
矩阵类运算指令在本采样周期内的cycle数和占比。 |
Mte0 |
L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。 |
Mte1 |
片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。 |
Mte2 |
AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。 |
Scalar |
标量类运算指令在本采样周期内的cycle数和占比。 |
Vector |
向量类运算指令在本采样周期内的cycle数和占比。 |
父主题: device目录timeline数据