AI Core和AI Vector的带宽和延时数据

Atlas 200/300/500 推理产品:不支持

Atlas 200/500 A2推理产品:不支持

Atlas 推理系列产品(Ascend 310P处理器):不支持

Atlas 训练系列产品:不支持

AI Core、AI Vector Core和BIU的带宽和延时数据instr_*.json。

instr_*.json在Chrome浏览器中展示如下。

图1 biu_group
图2 aic_core_group
图3 aiv_core_group

关键字段说明如下。

表1 字段说明

字段名

字段含义

Bandwidth Read

BIU单元读取指令时的带宽。

Bandwidth Write

BIU单元写入指令时的带宽。

Latency Read

BIU单元读取指令时的时延。

Latency Write

BIU单元写入指令时的时延。

Cube

矩阵类运算指令在本采样周期内的cycle数和占比。

Mte0

L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。

Mte1

HBM->AICORE搬运类指令在本采样周期内的cycle数和占比。

Mte2

AICORE->HBM搬运类指令在本采样周期内的cycle数和占比。

Scalar

标量类运算指令在本采样周期内的cycle数和占比。

Vector

向量类运算指令在本采样周期内的cycle数和占比。