AI Core和AI Vector的带宽和延时数据

Atlas 200/300/500 推理产品:不支持

Atlas 200/500 A2推理产品:不支持

Atlas 推理系列产品(Ascend 310P处理器):不支持

Atlas 训练系列产品:不支持

该数据可以从以下入口查看:

该数据在Chrome浏览器中展示示例如下:

图1 biu_group
图2 aic_core_group
图3 aiv_core_group

关键字段说明如下。

表1 字段说明

字段名

字段含义

Bandwidth Read

BIU单元读取指令时的带宽。

Bandwidth Write

BIU单元写入指令时的带宽。

Latency Read

BIU单元读取指令时的时延。

Latency Write

BIU单元写入指令时的时延。

Cube

矩阵类运算指令在本采样周期内的cycle数和占比。

Mte1

L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。

Mte2

HBM->AICORE搬运类指令在本采样周期内的cycle数和占比。

Mte3

AICORE->HBM搬运类指令在本采样周期内的cycle数和占比。

Mte0

L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。

Mte1

HBM->AICORE搬运类指令在本采样周期内的cycle数和占比。

Mte2

AICORE->HBM搬运类指令在本采样周期内的cycle数和占比。

Scalar

标量类运算指令在本采样周期内的cycle数和占比。

Vector

向量类运算指令在本采样周期内的cycle数和占比。