每个Core上指令占比数据ai_core_utilization_*.csv。
ai_core_utilization_*.csv文件内容格式示例如下。
关键字段说明如下。
字段名 |
字段解释 |
---|---|
Core ID |
Core ID。 |
vec_ratio |
代表vec类型指令(向量类运算指令)的cycle数与total cycle的比值。 |
mac_ratio |
代表cube类型指令(矩阵类运算指令)的cycle数与total cycle的比值。 |
mac_ratio |
代表cube类型指令(fp16及s16矩阵类运算指令)的cycle数与total cycle的比值。 (Atlas A2训练系列产品) |
scalar_ratio |
代表scalar类型指令(标量类运算指令)的cycle数与total cycle的比值。 (Atlas A2训练系列产品) |
fixpipe_ratio |
代表fixpipe类型指令(L0C->OUT/L1搬运类指令)的cycle数与total cycle的比值。 (Atlas A2训练系列产品) |
mte1_ratio |
代表mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数与total cycle的比值。 |
mte2_ratio |
代表mte2类型指令(DDR->AICORE搬运类指令)的cycle数与total cycle的比值。 |
mte2_ratio |
代表mte2类型指令(HBM->AICORE搬运类指令)的cycle数与total cycle的比值。 (Atlas A2训练系列产品) |
mte3_ratio |
代表mte3类型指令(AICORE->DDR搬运类指令)的cycle数与total cycle的比值。 |
mte3_ratio |
代表mte3类型指令(AICORE->HBM搬运类指令)的cycle数与total cycle的比值。 (Atlas A2训练系列产品) |
icache_miss_rate |
icache是为instruction预留的L2 Cache,icache_miss_rate数值高代表AI Core读取指令的效率低。 |
memory_bound |
用于识别AICore执行算子计算过程是否存在Memory瓶颈,由mte2_ratio/max(mac_ratio, vec_ratio)计算得出。计算结果小于1,表示没有Memory瓶颈;计算结果大于1 则表示AI Core在执行Task过程中大部分时间都在做内存搬运而不是计算,且数值越大Memory瓶颈越严重。 |
此处以AI Core性能指标采集项以sample-based场景的PipeUtilization为例,更多参数解析参见AI Core/AI Vector Core性能指标采集项说明。 |