性能分析概要

专家系统分析完成,在输出结果开头会输出整体性能分析报告,展示整体性能概要。如图1所示。

图1 性能分析概要

输出字段含义请参见表1所示。

表1 性能分析概要字段说明

字段

说明

Summary Reoprt

模型性能分析概要。

Report of model performance

模型性能分析报告。

Summary information of model performance

模型性能分析总览。

Execute Time

执行时间。

Aicore Time(us)

AI Core执行时间,单位为us。

Task Duration(us)

任务执行时间,单位为us。

Avg BlockDim Usage

平均BlockDim利用率,算子执行时的平均核心数,反映芯片利用情况。

Calculate throughput

计算吞吐量。

Cube Throughput(GOps)

Cube吞吐量,单位为GOps。

Vector Throughput(GOps)

Vector吞吐量,单位为GOps。

Memory Redundant

内存冗余量。

Real Memory Input(GB)

真实内存读入量,单位为GB。

Real Memory Output(GB)

真实内存写出量,单位为GB。

Theory Memory Input(GB)

理论内存读入量,单位为GB。

Theory Memory Output(GB)

理论内存写出量,单位为GB。

Memory Read Redundant

内存读入冗余系数。真实内存读入量/理论内存读入量。

Memory Write Redundant

内存写出冗余系数。真实内存写出量/理论内存写出量。

Pipeline Bound

流水利用率。

Cube Ratio

Cube利用率。

Vector Ratio

Vector利用率。

Scalar Ratio

Scalar利用率。

MTE1 Bound

MTE1瓶颈。

MTE2 Bound

MTE2瓶颈。

MTE3 Bound

MTE3瓶颈。

Tiling Strategy

内存读入量的数据切片策略。数值达到0.8为优,Performance值为Good;小于0.8则为差,Performance值为Bad。根据Memory Redundant的数值计算得出。

基于Roofline模型的算子瓶颈识别与优化建议功能的分析概要需要该功能的数据计算得出,因此具体内容在该功能输出结果后面展示,如图2所示。