产品支持情况:Atlas A2训练系列产品。
AI Core、AI Vector Core和BIU的带宽和延时数据instr_*.json。
instr_*.json在Chrome浏览器中展示如下。
关键字段说明如下。
字段名 |
字段含义 |
---|---|
Cube |
矩阵类运算指令。 |
Mte0 |
L1->L0A/L0B搬运类指令。 |
Mte1 |
片上内存->AICORE搬运类指令。 |
Mte2 |
AICORE->片上内存搬运类指令。 |
Scalar |
标量类运算指令。 |
Vector |
向量类运算指令。 |
Start |
显示界面中时间轴上的时刻点,chrome trace自动对齐,单位ms。 |
Wall Duration |
表示当前阶段指令总耗时,单位ms。 |
Self Time |
表示当前指令本身执行耗时,单位ms。 |
cycle_num |
执行指令需要的cycle数。 |
ratio |
执行指令需要的cycle数在所有指令的cycle数中的占用比。 |
Bandwidth Read |
BIU单元读取指令时的带宽。 |
Bandwidth Write |
BIU单元写入指令时的带宽。 |
Latency Read |
BIU单元读取指令时的时延。 |
Latency Write |
BIU单元写入指令时的时延。 |