系统功能展示
统计信息
MindStudio Insight支持算子统计信息和单个算子详情信息查看。
- 选中一个三层级泳道,使用鼠标左键框选部分算子后,可在下方“选中列表”页签中显示算子的统计信息,如图1所示,字段解释如表1所示。
单击“选中列表”列中的某个算子,在右侧“More”列表中将会显示此区域中与该算子同名的所有算子,单击“More”列表中某一行,则在时间线视图中定位出该算子的具体位置。
- 当选中单个算子时,可在下方“选中详情”页签中显示该算子的详情信息,如图2所示,字段解释如表2所示。
表2 选中详情字段说明 中文字段
英文字段
说明
标题
Title
名称。
开始
Start
起始时间。
持续时间
Wall Duration
总耗时。
自用时间
Self Time
总耗时(不包括子类)。
输入Shapes
Input Shapes
算子输入维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入数据类型
Input Data Types
算子输入数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入格式
Input Formats
算子输入数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出Shapes
Output Shapes
算子的输出维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出数据类型
Output Data Types
算子输出数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出格式
Output Formats
算子输出数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
算子属性信息
Attr Info
算子属性信息。采集数据时task-time配置为l0或l1时,不采集该字段,显示为N/A;只有开启aclnn,task-time配置为l2时,才会采集该字段。
更多
More
更多信息。
统计系统视图
- 在“系统视图”页签,当选择 时,页面包含卡序号(Rank ID)选框、5种类型的算子汇总统计页签和算子详情(Kernel Details)(NPU上算子的详细信息),在卡序号选框中可以选择想要查看的卡。
5种算子类型包括Python API 汇总(Python API Summary)、CANN API 汇总(CANN API Summary)、Ascend HardWare Task 汇总(Ascend HardWare Task Summary)、HCCL 汇总(HCCL Summary)、覆盖分析(Overlap Analysis),算子信息如图3所示,字段解释如表3所示。
表3 统计系统视图字段说明 中文字段
英文字段
说明
名称
Name
名称。
时间(%)
Time(%)
总时间占比=该类的耗时总时间/所有耗时总时间。
总时间(us)
Total Time(us)
该类耗时总和。
调用数
Num Calls
被调用次数。
平均值(us)
Avg(us)
该类耗时的平均值。
最小值(us)
Min(us)
该类耗时的最小值。
最大值(us)
Max(us)
该类耗时的最大值。
算子详情(Kernel Details)展示NPU上算子的详细信息,如图4所示,字段解释如表4所示,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在区域三(图形化窗格)的具体位置,区域四(数据窗格)将会展示选中详情,展示该算子的具体信息。
表4 算子详情字段说明 中文字段
英文字段
说明
名称
Name
算子名称。单击名称后
,对算子可进行模糊搜索。
类型
Type
算子类型。单击字段名称后
,可进行模糊搜索。
加速器核
Accelerator Core
计算核类型。单击字段名称后
,可进行模糊搜索。
开始时间
Start Time
任务开始时间点。
时长(us)
Duration(us)
任务耗时。
等待时间(us)
Wait Time(us)
上一个任务的结束时间与当前任务的开始时间间隔,单位us
Block数量
Block Dim
任务运行切分数量,对应任务运行时核数。
输入Shapes
Input Shapes
算子的输入维度。单击字段名称后
,可进行模糊搜索。
输入数据类型
Input Data Types
算子输入数据类型。单击字段名称后
,可进行模糊搜索。
输入格式
Input Formats
算子输入数据格式。单击字段名称后
,可进行模糊搜索。
输出Shapes
Output Shapes
算子的输出维度。单击字段名称后
,可进行模糊搜索。
输出数据类型
Output Data Types
算子输出数据类型。单击字段名称后
,可进行模糊搜索。
输出格式
Output Formats
算子输出数据格式。单击字段名称后
,可进行模糊搜索。
点击跳转Timeline
Click To Timeline
单击“点击”跳转到算子在时间线视图上的具体位置,并且在区域四(数据窗格)展示该算子的详情。
专家系统视图
- 在“系统视图”页签,当选择 时,页面包含卡序号选框、5种类型专家建议系统页签,在卡序号选框中可以选择想要查看的卡。
5种专家建议系统包括亲和 API(Affinity API)、亲和优化器(Affinity Optimizer)、AICPU 算子(AICPU Operators)、ACLNN 算子(ACLNN Operators)、算子融合(Operators Fusion),如图5所示,字段解释如表5所示。
选择任一专家建议系统,右侧区域会显示该类专家建议系统的详细信息,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在区域三(图形化窗格)的具体位置,区域四(数据窗格)“选中详情”页签将会展示该算子的具体信息。
表5 专家系统视图字段说明 中文字段
英文字段
说明
名称
Name
算子名称。
当专家建议系统为亲和优化器(Affinity Optimizer)时无此参数。
原始API
Origin API
可融合API序列。
仅当专家建议系统为亲和 API(Affinity API)时存在。
替换API
Replacement API
等效亲和API。
仅当专家建议系统为亲和 API(Affinity API)时存在。
原始优化器
Origin Optimizer
可融合优化器。
仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。
替换优化器
Replacement Optimizer
可替换的优化器。
仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。
原始算子
Origin Operators
可融合的算子。
仅当专家建议系统为算子融合(Operators Fusion)时存在。
融合算子
Fused Operator
CANN层已融合的算子。
仅当专家建议系统为算子融合(Operators Fusion)时存在。
开始时间
Start Time
任务开始时间点。
时长(us)
Duration(us)
任务耗时。
进程Id
Process Id
进程id。
线程Id
Thread Id
线程id。
备注
Notes
提示信息。
当专家建议系统为Affinity Optimizer时无此参数。
点击跳转Timeline
Click To Timeline
单击“click”,跳转到算子在时间线视图上的具体位置,并且在区域四(数据窗格)展示该算子的Slice Detail。
事件视图
在时间线(Timeline)界面,支持在事件视图中显示泳道算子信息。
中文字段 |
英文字段 |
说明 |
---|---|---|
名称 |
Name |
算子名称。 |
开始时间 |
Start |
算子执开始时间。 |
时长(ns) |
Duration(ns) |
算子运行总耗时。 |
线程ID |
TID |
线程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
进程ID |
PID |
进程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
任务流名称 |
Stream Name |
Ascend Hardware泳道下的Stream任务流名称。 仅当选择Ascend Hardware泳道及其子泳道时存在。 |
通信域名称 |
Group Name |
通信算子集群名称。 仅当选择HCCL泳道及其Group子泳道时存在。 |
分析算子类型 |
Analysis Type |
分析算子类型。 仅当选择Overlap Analysis泳道及其子泳道时存在。 |
卡序号 |
Rank ID |
算子所在卡序号。 当选择Ascend Hardware、HCCL和Overlap Analysis泳道及其子泳道时存在。 |
点击跳转Timeline |
Click To Timeline |
单击“click”,跳转到算子在时间线视图上的具体位置,并且在 页签展示该算子的详情。 |

- Card层级不支持此功能。
- HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等线图泳道不支持此功能。
- HCCL泳道下的Plane子泳道不支持此功能。