单击下方数据窗格的AI Core Metrics,可以查看AI Core Metrics数据。
字段名 |
字段解释 |
---|---|
Task-based:Pipeline Utilization |
|
Task ID |
Task ID,用于识别task。 |
Stream ID |
Stream ID,用于识别stream。 |
Op Name |
算子名称,用于识别算子。 |
OP Type |
算子类型。 |
Task Start Time |
任务启动时间。 |
Task Duration(us) |
任务运行持续时间,单位为us。 |
Task Wait Time(us) |
任务等待时间,单位为us。 |
Aicore Time(us) |
AI Core运行时间,单位为us。 |
Total Cycles |
该Task的所有指令的cycle总数。 |
Vec Time(us) |
vec类型指令(向量类运算指令)耗时,单位为us。 |
Vec Ratio |
vector类型指令(向量类运算指令)的cycle数在所有指令的cycle数中的占用比。 |
Mac Time(us) |
cube类型指令(矩阵类运算指令)耗时,单位为us。 |
Mac Ratio |
cube类型指令(矩阵类运算指令)的cycle数在所有指令的cycle数中的占用比。 |
Scalar Time(us) |
scalar类型指令(标量类运算指令)耗时,单位为us。 |
Scalar Ratio |
scalar类型指令(标量类运算指令)的cycle数在所有指令 的cycle数中的占用比。 |
Mte1 Time(us) |
mte1类型指令(L1->L0A/L0B搬运类指令)耗时,单位为us。 |
Mte1 Ratio |
mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数在所 有指令的cycle数中的占用比。 |
Mte2 Time(us) |
mte2类型指令(DDR->AI Core搬运类指令)耗时,单位为us。 |
Mte2 Ratio |
mte2类型指令(DDR->AI Core搬运类指令)的cycle数在 所有指令的cycle数中的占用比。 |
Mte3 Time(us) |
mte3类型指令(AI Core->DDR搬运类指令)耗时,单位为us。 |
Mte3 Ratio |
mte3类型指令(AI Core->DDR搬运类指令)的cycle数在 所有指令的cycle数中的占用比。 |
Icache Miss Rate |
icache缺失率,即未命中icache,数值越小越好。 |
Memory Bound |
用于识别AI Core执行算子计算过程是否存在Memory瓶颈,由Mte2 Ratio/max(Mac Ratio, Vec Ratio)计算得出。计算结果小于1,表示没有Memory瓶颈;计算结果大于1则表示有Memory瓶颈,且数值越大越瓶颈严重。 |
Task-based:Arithmetic Utilization |
|
Task ID |
Task ID,用于识别task。 |
Stream ID |
Stream ID,用于识别stream。 |
Op Name |
算子名称,用于识别算子。 |
OP Type |
算子类型。 |
Task Start Time |
任务启动时间。 |
Task Duration(us) |
任务运行持续时间,单位为us。 |
Task Wait Time(us) |
任务等待时间,单位为us。 |
Aicore Time(us) |
AI Core运行时间,单位为us。 |
Total Cycles |
该Task的所有指令的cycle总数。 |
Mac Fp16 Ratio |
cube fp16类型指令的cycle数在所有指令的cycle数中的占用比。 |
Mac Int8 Ratio |
cube int8类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Fp32 Ratio |
vec fp32类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Fp16 Ratio |
vec fp16类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Int32 Ratio |
vec int32类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Misc Ratio |
vec misc类型指令的cycle数在所有指令的cycle数中的占用比。 |
Cube Fops |
cube类型的浮点运算数,即计算量,可用于衡量算法/模型的复杂度,其中Fops表示floating point operations,缩写为FLOPs。 |
Vector Fops |
vector类型浮点运算数,即计算量,可用于衡量算法/模型的复杂度,其中Fops表示floating point operations,缩写为FLOPs。 |
Task-based:UB/L1/L2/Main Memory Bandwidth |
|
Task ID |
Task ID,用于识别task。 |
Stream ID |
Stream ID,用于识别stream。 |
Op Name |
算子名称,用于识别算子。 |
OP Type |
算子类型。 |
Task Start Time |
任务启动时间。 |
Task Duration(us) |
任务运行持续时间,单位为us。 |
Task Wait Time(us) |
任务等待时间,单位为us。 |
Aicore Time(us) |
AI Core运行时间,单位为us。 |
Total Cycles |
该Task的所有指令的cycle总数。 |
ub_read_bw(GB/s) |
Ub读带宽速率,单位为GB/s。 |
ub_write_bw(GB/s) |
Ub写带宽速率,单位为GB/s。 |
l1_read_bw(GB/s) |
L1读带宽速率,单位为GB/s。 |
l1_write_bw(GB/s) |
L1写带宽速率,单位为GB/s。 |
l2_read_bw(GB/s) |
L2读带宽速率,单位为GB/s。 |
l2_write_bw(GB/s) |
L2写带宽速率,单位为GB/s。 |
main_mem_read_bw(GB/s) |
主存储器读带宽速率,单位为GB/s。 |
main_mem_write_bw(GB/s) |
主存储器写带宽速率,单位为GB/s。 |
Task-based:L0A/L0B/L0C Memory Bandwidth |
|
Task ID |
Task ID,用于识别task。 |
Stream ID |
Stream ID,用于识别stream。 |
Op Name |
算子名称,用于识别算子。 |
OP Type |
算子类型。 |
Task Start Time |
任务启动时间。 |
Task Duration(us) |
任务运行持续时间,单位为us。 |
Task Wait Time(us) |
任务等待时间,单位为us。 |
Aicore Time(us) |
AI Core运行时间,单位为us。 |
Total Cycles |
该Task的所有指令的cycle总数。 |
scalar_ld_ratio |
scalar access ub类型读指令的cycle数在所有指令的cycle数中的占用比。 |
scalar_st_ratio |
scalar access ub类型写指令的cycle数在所有指令的cycle数中的占用比。 |
l0a_read_bw(GB/s) |
L0a读带宽速率,单位为GB/s。 |
l0a_write_bw(GB/s) |
L0a写带宽速率,单位为GB/s。 |
l0b_read_bw(GB/s) |
L0b读带宽速率,单位为GB/s。 |
l0b_write_bw(GB/s) |
L0b写带宽速率,单位为GB/s。 |
l0c_read_bw(GB/s) |
vector从l0c读带宽速率,单位为GB/s。 |
l0c_write_bw(GB/s) |
vector向l0c写带宽速率,单位为GB/s。 |
l0c_read_bw_cube(GB/s) |
cube从l0c读带宽速率,单位为GB/s。 |
l0c_write_bw_cube(GB/s) |
cube向l0c写带宽速率,单位GB/s。 |
Task-based:UB Memory Bandwidth |
|
Task ID |
Task ID,用于识别task。 |
Stream ID |
Stream ID,用于识别stream。 |
Op Name |
算子名称,用于识别算子。 |
OP Type |
算子类型。 |
Task Start Time |
任务启动时间。 |
Task Duration(us) |
任务运行持续时间,单位为us。 |
Task Wait Time(us) |
任务等待时间,单位为us。 |
Aicore Time(us) |
AI Core运行时间,单位为us。 |
Total Cycles |
该Task的所有指令的cycle总数。 |
ub_read_bw_mte(GB/s) |
mte从ub读带宽速率,单位为GB/s。Atlas 200/300/500 推理产品支持。 |
ub_write_bw_mte(GB/s) |
mte向ub写带宽速率,单位为GB/s。Atlas 200/300/500 推理产品支持。 |
ub_read_bw_vector(GB/s) |
vector从ub读带宽速率,单位为GB/s。 |
ub_write_bw_vector(GB/s) |
vector向ub写带宽速率,单位为GB/s。 |
ub_read_bw_scalar(GB/s) |
scalar从ub读带宽速率,单位为GB/s。 |
ub_write_bw_scalar(GB/s) |
scalar向ub写带宽速率,单位为GB/s。 |
Sample-based:Pipeline Utilization |
|
Core ID |
AI Core ID,用于识别AI Core。 |
Vec Ratio |
vector类型指令(向量类运算指令)的cycle数在所有指令的cycle数中的占用比。 |
Mac Ratio |
cube类型指令(矩阵类运算指令)的cycle数在所有指令的cycle数中的占用比。 |
Scalar Ratio |
scalar类型指令(标量类运算指令)的cycle数在所有指令的cycle数中的占用比。 |
Mte1 Ratio |
mte1类型指令(L1->L0A/L0B搬运类指令)的cycle数在所有指令的cycle数中的占用比。 |
Mte2 Ratio |
mte2类型指令(DDR->AI Core搬运类指令)的cycle数在所有指令的cycle数中的占用比。 |
Mte3 Ratio |
mte3类型指令(AI Core->DDR搬运类指令)的cycle数在所有指令的cycle数中的占用比。 |
Icache Miss Rate |
icache缺失率,即未命中icache,数值越小越好。 |
Memory Bound |
用于识别AI Core执行算子计算过程是否存在内存瓶颈,由mte2_ratio/max(mac_ratio, vec_ratio)计算得出。计算结果小于1表示没有内存瓶颈;计算结果大于1表示有内存瓶颈,且数值越大瓶颈越严重。 |
Sample-based:Arithmetic Utilization |
|
Core ID |
AI Core ID,用于识别AI Core。 |
Mac Fp16_ratio |
cube fp16类型指令的cycle数在所有指令的cycle数中的占用比。 |
Mac Int8 Ratio |
cube int8类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Fp32 Ratio |
vec fp32类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Fp16 Ratio |
vec fp16类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Int32 Ratio |
vec int32类型指令的cycle数在所有指令的cycle数中的占用比。 |
Vec Misc Ratio |
vec misc类型指令的cycle数在所有指令的cycle数中的占用比。 |
Cube Fops |
Cube类型每秒浮点运算次数。 |
Vector Fops |
Vector类型每秒浮点运算次数。 |
Sample-based:UB/L1/L2/Main Memory Bandwidth |
|
Core ID |
AI Core ID,用于识别AI Core。 |
ub_read_bw(GB/s) |
Ub读带宽速率,单位为GB/s。 |
ub_write_bw(GB/s) |
Ub写带宽速率,单位为GB/s。 |
l1_read_bw(GB/s) |
L1读带宽速率,单位为GB/s。 |
l1_write_bw(GB/s) |
L1写带宽速率,单位为GB/s。 |
l2_read_bw(GB/s) |
L2读带宽速率,单位为GB/s。 |
l2_write_bw(GB/s) |
L2写带宽速率,单位为GB/s。 |
main_mem_read_bw(GB/s) |
主存储器读带宽速率,单位为GB/s。 |
main_mem_write_bw(GB/s) |
主存储器写带宽速率,单位为GB/s。 |
Sample-based:L0A/L0B/L0C Memory Bandwidth |
|
Core ID |
AI Core ID,用于识别AI Core。 |
l0a_read_bw(GB/s) |
L0a读带宽速率,单位为GB/s。 |
l0a_write_bw(GB/s) |
L0a写带宽速率,单位为GB/s。 |
l0b_read_bw(GB/s) |
L0b读带宽速率,单位为GB/s。 |
l0b_write_bw(GB/s) |
L0b写带宽速率,单位为GB/s。 |
l0c_read_bw(GB/s) |
vector从l0c读带宽速率,单位为GB/s。 |
l0c_write_bw(GB/s) |
vector向l0c写带宽速率,单位为GB/s。 |
l0c_read_bw_cube(GB/s) |
cube从l0c读带宽速率,单位为GB/s。 |
l0c_write_bw_cube(GB/s) |
cube向l0c写带宽速率,单位GB/s。 |
Sample-based:UB Memory Bandwidth |
|
Core ID |
AI Core ID,用于识别AI Core。 |
ub_read_bw_vector(GB/s) |
vector从ub读带宽速率,单位为GB/s。 |
ub_write_bw_vector(GB/s) |
vector向ub写带宽速率,单位为GB/s。 |
ub_read_bw_scalar(GB/s) |
scalar从ub读带宽速率,单位为GB/s。 |
ub_write_bw_scalar(GB/s) |
scalar向ub写带宽速率,单位为GB/s。 |
ub_read_bw_mte(GB/s) |
mte从ub读带宽速率,单位为GB/s。Atlas 200/300/500 推理产品支持。 |
ub_write_bw_mte(GB/s) |
mte向ub写带宽速率,单位为GB/s。Atlas 200/300/500 推理产品支持。 |