系统功能展示
统计信息
MindStudio Insight支持算子统计信息和单个算子详情信息查看。
- 使用鼠标左键在单个三层级泳道上框选部分算子,或在单卡层级下跨多个泳道框选部分算子,框选部分区域算子后,可在下方“选中列表”页签中显示算子的统计信息,如图1所示,字段解释如表1所示。
在单卡下跨多个泳道框选算子的情况下,HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道的框选部分不会在“选中列表”中统计。
单击“选中列表”列中的某个算子,在右侧“More”列表中将会显示此区域中与该算子同名的所有算子,单击“More”列表中某一行,则在时间线视图中定位出该算子的具体位置,并同时跳转至“选中详情”页面,可查看该算子的详情信息。 - 当选中单个算子时,可在下方“选中详情”页签中显示该算子的详情信息,如图2所示,字段解释如表2所示。
表2 选中详情字段说明 中文字段
英文字段
说明
标题
Title
名称。
开始
Start
起始时间。
持续时间
Wall Duration
总耗时。
自用时间
Self Time
总耗时(不包括子类)。
输入Shapes
Input Shapes
算子输入维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入数据类型
Input Data Types
算子输入数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入格式
Input Formats
算子输入数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出Shapes
Output Shapes
算子的输出维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出数据类型
Output Data Types
算子输出数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出格式
Output Formats
算子输出数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
算子属性信息
Attr Info
算子属性信息。采集数据时task-time配置为l0或l1时,不采集该字段,显示为N/A;只有开启aclnn,task-time配置为l2时,才有此该字段。
参数
Args
算子的相关参数信息。
统计系统视图
在“系统视图”页签,当选择 时,页面包含卡序号(Rank ID)选框、5种类型的算子汇总统计页签和算子详情(Kernel Details)(NPU上算子的详细信息),在卡序号选框中可以选择想要查看的卡。
5种算子类型包括Python API 汇总(Python API Summary)、CANN API 汇总(CANN API Summary)、Ascend HardWare Task 汇总(Ascend HardWare Task Summary)、HCCL 汇总(HCCL Summary)、覆盖分析(Overlap Analysis),算子信息如图3所示,字段解释如表3所示。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
名称。 |
时间(%) |
Time(%) |
总时间占比 = 该类的耗时总时间 / 所有耗时总时间。 当统计类型为覆盖分析(Overlap Analysis)时,时间占比 = 该类的耗时总时间 /(Communication(Not Overlapped)总时间 + Computing总时间 + Free总时间)。 |
总时间(us) |
Total Time(us) |
该类耗时总和。 |
调用数 |
Num Calls |
被调用次数。 |
平均值(us) |
Avg(us) |
该类耗时的平均值。 |
最小值(us) |
Min(us) |
该类耗时的最小值。 |
最大值(us) |
Max(us) |
该类耗时的最大值。 |
算子详情(Kernel Details)展示NPU上算子的详细信息,如图4所示,字段解释如表4所示,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)将会展示选中详情,展示该算子的具体信息。单击算子详情表中字段名称后的,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 |
类型 |
Type |
算子类型。 |
加速器核 |
Accelerator Core |
计算核类型。 |
开始时间 |
Start Time |
任务开始时间点。 |
时长(us) |
Duration(us) |
任务耗时。 |
等待时间(us) |
Wait Time(us) |
上一个任务的结束时间与当前任务的开始时间间隔,单位us |
Block数量 |
Block Dim |
任务运行切分数量,对应任务运行时核数。 |
输入Shapes |
Input Shapes |
算子的输入维度。 |
输入数据类型 |
Input Data Types |
算子输入数据类型。 |
输入格式 |
Input Formats |
算子输入数据格式。 |
输出Shapes |
Output Shapes |
算子的输出维度。 |
输出数据类型 |
Output Data Types |
算子输出数据类型。 |
输出格式 |
Output Formats |
算子输出数据格式。 |
点击跳转Timeline |
Click To Timeline |
单击“点击”,跳转到算子在时间线视图上的具体位置,并且在区域四(数据窗格)展示该算子的详情。 |
专家系统视图
在“系统视图”页签,当选择 时,页面包含卡序号选框、5种类型专家建议系统页签,在卡序号选框中可以选择想要查看的卡。
5种专家建议系统包括亲和 API(Affinity API)、亲和优化器(Affinity Optimizer)、AICPU 算子(AICPU Operators)、ACLNN 算子(ACLNN Operators)、算子融合(Operators Fusion),如图5所示,字段解释如表5所示。
选择任一专家建议系统,右侧区域会显示该类专家建议系统的详细信息,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)“选中详情”页签将会展示该算子的具体信息。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 当专家建议系统为亲和优化器(Affinity Optimizer)时无此参数。 |
原始API |
Origin API |
可融合API序列。 仅当专家建议系统为亲和 API(Affinity API)时存在。 |
替换API |
Replacement API |
等效亲和API。 仅当专家建议系统为亲和 API(Affinity API)时存在。 |
原始优化器 |
Origin Optimizer |
可融合优化器。 仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。 |
替换优化器 |
Replacement Optimizer |
可替换的优化器。 仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。 |
原始算子 |
Origin Operators |
可融合的算子。 仅当专家建议系统为算子融合(Operators Fusion)时存在。 |
融合算子 |
Fused Operator |
CANN层已融合的算子。 仅当专家建议系统为算子融合(Operators Fusion)时存在。 |
开始时间 |
Start Time |
任务开始时间点。 |
时长(us) |
Duration(us) |
任务耗时。 |
进程Id |
Process Id |
进程id。 |
线程Id |
Thread Id |
线程id。 |
备注 |
Notes |
提示信息。 当专家建议系统为Affinity Optimizer时无此参数。 |
点击跳转Timeline |
Click To Timeline |
单击“点击”,跳转到算子在时间线视图中的具体位置,并且在区域四(数据窗格)展示该算子的详情。 |
事件视图
在时间线(Timeline)界面,支持在事件视图中显示算子信息。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 |
开始时间 |
Start |
算子执开始时间。 |
时长(ns) |
Duration(ns) |
算子运行总耗时。 |
线程ID |
TID |
线程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
进程ID |
PID |
进程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
任务流名称 |
Stream Name |
Ascend Hardware泳道下的Stream任务流名称。 仅当选择Ascend Hardware泳道及其子泳道时存在。 |
通信域名称 |
Group Name |
通信算子集群名称。 仅当选择HCCL泳道及其Group子泳道时存在。 |
分析算子类型 |
Analysis Type |
分析算子类型。 仅当选择Overlap Analysis泳道及其子泳道时存在。 |
卡序号 |
Rank ID |
算子所在卡序号。 当选择Ascend Hardware、HCCL和Overlap Analysis泳道及其子泳道时存在。 |
点击跳转Timeline |
Click To Timeline |
单击“click”,跳转到算子在时间线视图上的具体位置,并且在 页签展示该算子的详情。 |

- Card层级不支持此功能。
- HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道不支持此功能。
- HCCL泳道下的Plane子泳道不支持此功能。