开发者
下载

biu_group/aic_core_group/aiv_core_group(AI Core和AI Vector的带宽和延时)

AI Core和AI Vector的带宽和延时数据无summary信息,timeline信息在msprof_*.json文件的biu_group、aic_core_group、aiv_core_group层级展示。

产品支持情况

产品

是否支持

Atlas 350 加速卡

Atlas A3 训练系列产品/Atlas A3 推理系列产品

Atlas A2 训练系列产品/Atlas A2 推理系列产品

Atlas 200I/500 A2 推理产品

x

Atlas 推理系列产品

x

Atlas 训练系列产品

x

msprof_*.json文件的biu_group、aic_core_group、aiv_core_group层级数据说明

Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品数据为例。

图1 biu_group
图2 aic_core_group
图3 aiv_core_group
表1 字段说明(biu_group)

字段名

字段含义

Bandwidth Read

BIU总线接口单元读取指令时的带宽。

Bandwidth Write

BIU总线接口单元写入指令时的带宽。

Latency Read

BIU总线接口单元读取指令时的时延。

Latency Write

BIU总线接口单元写入指令时的时延。

以上biu_group层级为Atlas A3 训练系列产品/Atlas A3 推理系列产品Atlas A2 训练系列产品/Atlas A2 推理系列产品数据,对于Atlas 350 加速卡,则为Biu Perf层级(BIU指令流水),下层则是以Group{id}-{核id}的维度进行分组,例如Group0-aiv0,分组下的字段和biu_group层级一致。

表2 字段说明(aic_core_group)

字段名

字段含义

Cube

矩阵类运算指令在本采样周期内的cycle数和占比。

Mte1

L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。

Mte2

片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。

Mte3

AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。

表3 字段说明(aiv_core_group)

字段名

字段含义

Mte1

L1->L0A/L0B搬运类指令在本采样周期内的cycle数和占比。

Mte2

片上内存->AICORE搬运类指令在本采样周期内的cycle数和占比。

Mte3

AICORE->片上内存搬运类指令在本采样周期内的cycle数和占比。

Scalar

标量类运算指令在本采样周期内的cycle数和占比。

Vector

向量类运算指令在本采样周期内的cycle数和占比。