专家系统分析完成,在输出结果开头会输出整体性能分析报告,展示整体性能概要。如图1所示。
输出字段含义请参见表1所示。
字段 |
说明 |
---|---|
Summary Reoprt |
模型性能分析概要。 |
Report of model performance |
模型性能分析报告。 |
Summary information of model performance |
模型性能分析总览。 |
Execute Time |
执行时间。 |
Aicore Time(us) |
AI Core执行时间,单位为us。 |
Task Duration(us) |
任务执行时间,单位为us。 |
Avg BlockDim Usage |
平均BlockDim利用率,算子执行时的平均核心数,反映芯片利用情况。 |
Calculate throughput |
计算吞吐量。 |
Cube Throughput(GOps) |
Cube吞吐量,单位为GOps。 |
Vector Throughput(GOps) |
Vector吞吐量,单位为GOps。 |
Memory Redundant |
内存冗余量。 |
Real Memory Input(GB) |
真实内存读入量,单位为GB。 |
Real Memory Output(GB) |
真实内存写出量,单位为GB。 |
Theory Memory Input(GB) |
理论内存读入量,单位为GB。 |
Theory Memory Output(GB) |
理论内存写出量,单位为GB。 |
Memory Read Redundant |
内存读入冗余系数。真实内存读入量/理论内存读入量。 |
Memory Write Redundant |
内存写出冗余系数。真实内存写出量/理论内存写出量。 |
Pipeline Bound |
流水利用率。 |
Cube Ratio |
Cube利用率。 |
Vector Ratio |
Vector利用率。 |
Scalar Ratio |
Scalar利用率。 |
MTE1 Bound |
MTE1瓶颈。 |
MTE2 Bound |
MTE2瓶颈。 |
MTE3 Bound |
MTE3瓶颈。 |
Tiling Strategy |
内存读入量的数据切片策略。数值达到0.8为优,Performance值为Good;小于0.8则为差,Performance值为Bad。根据Memory Redundant的数值计算得出。 |