AI Core和AI Vector的带宽和延时数据

产品支持情况:Atlas A2训练系列产品

AI Core、AI Vector Core和BIU的带宽和延时数据instr_*.json。

instr_*.json在Chrome浏览器中展示如下。

图1 aic_core_group
图2 aiv_core_group
图3 biu_group

关键字段说明如下。

表1 字段说明

字段名

字段含义

Cube

矩阵类运算指令。

Mte0

L1->L0A/L0B搬运类指令。

Mte1

片上内存->AICORE搬运类指令。

Mte2

AICORE->片上内存搬运类指令。

Scalar

标量类运算指令。

Vector

向量类运算指令。

Start

显示界面中时间轴上的时刻点,chrome trace自动对齐,单位ms。

Wall Duration

表示当前阶段指令总耗时,单位ms。

Self Time

表示当前指令本身执行耗时,单位ms。

cycle_num

执行指令需要的cycle数。

ratio

执行指令需要的cycle数在所有指令的cycle数中的占用比。

Bandwidth Read

BIU单元读取指令时的带宽。

Bandwidth Write

BIU单元写入指令时的带宽。

Latency Read

BIU单元读取指令时的时延。

Latency Write

BIU单元写入指令时的时延。