界面介绍
功能说明
详情(Details)界面用于展示算子基础信息、计算负载分析和内存负载分析,并以柱状图和数据窗格呈现方式显示分析结果。
界面展示
请参见导入数据章节导入msprof 采集的算子Profiling的bin文件,获取bin文件请参见《算子工具使用指南》中“工具使用”章节的“msprof op”内容。

只支持导入单个二进制bin文件,不支持以文件夹方式导入。
详情(Details)界面包含基础信息(Base Info)(区域一)、计算工作负载分析(Compute Workload Analysis)(区域二)和内存负载分析(Memory Workload Analysis)(区域三),如图1所示。
- 区域一:基础信息(Base Info),可查看算子基础信息,包含名称、芯片、时长、类型等内容,参数详细说明如表1所示。
表1 基本信息参数说明 中文参数
英文参数
说明
名称
Name
算子名称。
芯片
Soc
算子运行平台。
时长 (μs)
Duration (μs)
算子总耗时。
算子类型
Op Type
算子类型。有mix、vector、cube和AiCore四种类型。
Block数量
Block Dim
Sub Block的数量。当算子类型为vector、cube和AiCore时,为此参数名称。
混合Block数量
Mix Block Dim
Sub Block的数量。当算子类型为mix时,为此参数名称。
Block详情
Block Detail
Sub Block耗时详情。当算子类型为vector、cube和AiCore时,为此参数名称,其中字段解释如表2所示。
混合Block详情
Mix Block Detail
Sub Block耗时详情。当算子类型为mix时,为此参数名称,其中字段解释如表3所示。
- 区域二:计算工作负载分析,以柱状图和数据窗格呈现方式查看相应信息,便于开发人员分析。如图2所示,参数详细说明如表4所示。
表4 计算工作负载分析参数说明 中文参数
英文参数
说明
Block ID
Block ID
Sub Block序号。可通过切换Block ID来查看对应信息。
当算子类型为AiCore时,此参数显示NA,展示的是多核平均值。
Pipe Utilization
Pipe Utilization
Pipe(指令队列)可视化,以柱状图方式展示。
- 横坐标:Cycles占比,计算方式为Cycles/总的Cycles。Cycles为该指令在Sub Block上执行消耗的时钟周期。
- 纵坐标:算子指令,由bin文件的数据中提供。
CUBE
CUBE
cube类型的指令名称。当算子类型为cube时,显示此参数。
CUBE0
CUBE0
cube类型的指令名称。当算子类型为mix时,显示此参数。
VECTOR
VECTOR
vector类型的指令名称。当算子类型为vector和cube时,显示此参数。
VECTOR0
VECTOR0
vector类型的指令名称。当算子类型为mix时,显示此参数。
VECTOR1
VECTOR1
vector类型的指令名称。当算子类型为mix时,显示此参数。
AICORE
AICORE
AiCore类型的指令名称。当算子类型为AiCore时,显示此参数。
指令数
Instructions
算子指令数量。
时长(μs)
Duration(μs)
算子指令耗时。
数据搬运量(byte)
Data Volume(byte)
算子指令数据量。
- 区域三:内存负载分析,以内存热力图和数据窗格呈现方式查看相应信息,如图3所示,参数配置如表5所示。热力图左侧的“Peak”为箭头颜色,值为峰值带占比(最大带宽占比)。
表5 参数配置 中文参数
英文参数
说明
Block ID
Block ID
Sub Block序号。在Block ID选框中可以选择想要查看的Sub Block。
当算子类型为AiCore时,Block ID显示NA,展示的是多核平均值。
显示为
Show As
可选项,选择热力图连线箭头内容以请求数或者带宽展示。热力图箭头代表流向。
- 请求数(Num of Request)
- 带宽(Bandwidth)
数据窗格呈现内容随算子类型而变化,内容是bin文件的数据解析结果,具体呈现如下:
- 当算子类型为AiCore时,表格窗格内容如表6所示。
- 当算子类型为mix时,表格窗格内容如表7所示。
表7 mix类型 中文参数
英文参数
说明
Cache
Cache
L2缓存。
命中次数
Hit
cache命中次数。
未命中次数
Miss
cache未命中后重新分配缓存的次数。
总次数
Total
cache请求总次数。
命中率(%)
Hit Rate(%)
cache命中率。
Cube
Cube
cube计算单元。
HBM Cube
HBM Cube
cube单元的高带宽存储器单元。
HBM Vector Core0
HBM Vector Core0
aicore内core0的vector单元的高带宽存储器单元。
HBM Vector Core1
HBM Vector Core1
aicore内core1的vector单元的高带宽存储器单元。
L0A
L0A
L0A储存单元。
L0B
L0B
L0B储存单元。
L0C
L0C
L0C储存单元。
L1
L1
L1储存单元。
请求数
Requests
操作数量。
吞吐量(GB/s)
Throughput(GB/s)
吞吐量,表示通路每秒的传输数据量,单位为 GB/s。
峰值(最大带宽占比)(%)
Peak(%)
与理论带宽的比率。
Pipe Cube
Pipe Cube
cube单元的计算通路。
Pipe Vector Core0
Pipe Vector Core0
aicore内core0的vector单元的计算通路。
Pipe Vector Core1
Pipe Vector Core1
aicore内core1的vector单元的计算通路。
指令数
Instructions
指令数量。
时钟周期
Cycle
通路消耗的时钟周期。
等待周期
Wait Cycles
对应pipe上被阻塞的cycle数。
活跃率(%)
Active Rate(%)
运行cycle数占总的cycle的百分比。
UB Core0
UB Core0
mix算子aicore内core0的ub储存单元。
UB Core1
UB Core1
mix算子aicore内core1的ub储存单元。
Vector
Vector core0
vector计算单元。
- 当算子类型为vector时,表格窗格内容如表8所示。
表8 vector类型 中文参数
英文参数
说明
Cache
Cache
L2缓存。
命中次数
Hit
cache命中次数。
未命中次数
Miss
cache未命中后重新分配缓存的次数。
总次数
Total
cache请求总次数。
命中率(%)
Hit Rate(%)
cache命中率。
HBM
HBM
高带宽存储器单元。
请求数
Requests
操作数量。
吞吐量(GB/s)
Throughput(GB/s)
吞吐量,表示通路每秒的传输数据量,单位为 GB/s。
Pipe
Pipe
计算通路。
指令数
Instructions
指令数量。
时钟周期
Cycle
通路消耗的时钟周期。
等待周期
Wait Cycles
对应pipe上被阻塞的cycle数。
活跃率(%)
Active Rate(%)
运行cycle数占总的cycle的百分比。
UB
UB
ub储存单元。
Vector
Vector
vector计算单元。
峰值(最大带宽占比)(%)
Peak(%)
与理论带宽的比率。
- 当算子类型为cube时,表格窗格内容如表9所示。
表9 cube类型 中文参数
英文参数
说明
Cache
Cache
L2缓存。
命中次数
Hit
cache命中次数。
未命中次数
Miss
cache未命中后重新分配缓存的次数。
总次数
Total
cache请求总次数。
命中率(%)
Hit Rate(%)
cache命中率。
Cube
Cube
cube计算单元。
HBM
HBM
高带宽存储器单元。
L0A
L0A
L0A储存单元。
L0B
L0B
L0B储存单元。
L0C
L0C
L0C储存单元。
L1
L1
L1储存单元。
请求数
Requests
操作数量。
吞吐量(GB/s)
Throughput(GB/s)
吞吐量,表示通路每秒的传输数据量,单位为 GB/s。
峰值(最大带宽占比)(%)
Peak(%)
与理论带宽的比率。
Pipe
Pipe
计算通路。
指令数
Instructions
指令数量。
时钟周期
Cycle
通路消耗的时钟周期。
等待周期
Wait Cycles
对应pipe上被阻塞的cycle数。
活跃率(%)
Active Rate(%)
运行cycle数占总的cycle的百分比。