昇腾社区首页
中文
注册

每个Core上指令占比数据说明

请参见导出summary数据获取每个Core上指令占比数据ai_core_utilization_{device_id}_{model_id}_{iter_id}.csv,其中{device_id}表示设备ID,{model_id}表示模型ID,{iter_id}表示某轮迭代的ID号。

ai_core_utilization_{device_id}_{model_id}_{iter_id}.csv文件内容格式示例如下。

导出的每个Core上指令占比数据表文件列说明如下。

表1 字段说明

参数名

参数解释

Core ID

Core ID。

vec_ratio

代表vec类型指令(向量类运算指令)的cycle数在所有指令的cycle数中的占用比。

mac_ratio

代表cube类型指令(矩阵类运算指令)的cycle数在所有指令的cycle数中的占用比。

scalar_ratio

代表scalar类型指令(标量类运算指令)的cycle数在所有指令的cycle数中的占用比。

mte1_ratio

代表mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数在所有指令的cycle数中的占用比。

mte2_ratio

代表mte2类型指令(DDR->AICORE搬运类指令)的cycle数在所有指令的cycle数中的占用比。

mte3_ratio

代表mte3类型指令(AICORE->DDR搬运类指令)的cycle数在所有指令的cycle数中的占用比。

icache_miss_rate

代表icache缺失率,即未命中icache,数值越小越好。

memory_bound

用于识别AICore执行算子计算过程是否存在Memory瓶颈,由mte2_ratio/max(mac_ratio, vec_ratio)计算得出。计算结果小于1,表示没有Memory瓶颈;计算结果大于1 则表示有Memory瓶颈,且数值越大越瓶颈严重。