AI Core和AI Vector的带宽和延时数据
AI Core和AI Vector的带宽和延时数据无summary信息,timeline信息在msprof_*.json文件的biu_group、aic_core_group、aiv_core_group层级展示。
支持的型号
Atlas A2训练系列产品/Atlas 800I A2推理产品
msprof*.json文件的biu_group、aic_core_group、aiv_core_group层级数据说明
图1 biu_group
图2 aic_core_group
图3 aiv_core_group
|
字段名 |
字段含义 |
|---|---|
|
Bandwidth Read |
BIU单元读取指令时的带宽。 |
|
Bandwidth Write |
BIU单元写入指令时的带宽。 |
|
Latency Read |
BIU单元读取指令时的时延。 |
|
Latency Write |
BIU单元写入指令时的时延。 |
|
Cube |
矩阵类运算指令在本采样周期内的cycle数和占比。 |
|
Mte1 |
L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。 |
|
Mte2 |
片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。 |
|
Mte3 |
AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。 |
|
Mte0 |
L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。 |
|
Mte1 |
片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。 |
|
Mte2 |
AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。 |
|
Scalar |
标量类运算指令在本采样周期内的cycle数和占比。 |
|
Vector |
向量类运算指令在本采样周期内的cycle数和占比。 |
父主题: json和csv文件性能数据说明