系统功能展示
统计信息
MindStudio Insight支持算子统计信息和单个算子详情信息查看。
- 使用鼠标左键在单个三层级泳道上框选部分算子,或在单卡层级下跨多个泳道框选部分算子,框选部分区域算子后,可在下方“选中列表”页签中显示算子的统计信息,如图1所示,字段解释如表1所示。当鼠标移入“选中列表”页签,单击表格右上角
按钮,一键复制当前“选中列表”中所展示的内容,并粘贴至Excel表格中进行分析。
在单卡下跨多个泳道框选算子的情况下,HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道的框选部分不会在“选中列表”中统计。
单击“选中列表”列中的某个算子,在右侧“More”列表中将会显示此区域中与该算子同名的所有算子,单击“More”列表中某一行,则在时间线视图中定位出该算子的具体位置,并同时跳转至“选中详情”页面,可查看该算子的详情信息。表1 选中列表字段说明 中文字段
英文字段
说明
名称
Name
算子名称。
持续时间
Wall Duration
算子执行总耗时。
自用时间
Self Time
算子执行时间(不包括调用的子算子时间)。
平均持续时间
Average Wall Duration
算子平均执行时间。
最大持续时间
Max Wall Duration
算子最大持续时间。
最小持续时间
Min Wall Duration
算子最小持续时间。
发生次数
Occurrences
算子调用次数。
索引
Index
序号。
时间戳
Timestamp
在图形化窗格中的时间戳。
时长(ns)
Duration(ns)
执行耗时。
- 当选中单个算子时,可在下方“选中详情”页签中显示该算子的详情信息,如图2所示,字段解释如表2所示。选中单个算子,使用M键,可框选该算子所属的时间线(Timeline)区域,再次按下M键,可取消框选。
表2 选中详情字段说明 中文字段
英文字段
说明
标题
Title
名称。
开始
Start
起始时间。
开始(原始时间戳)
Start(Raw Timestamp)
数据采集到的原始开始时间。
持续时间
Wall Duration
总耗时。
自用时间
Self Time
总耗时(不包括子类)。
输入Shapes
Input Shapes
算子输入维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入数据类型
Input Data Types
算子输入数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输入格式
Input Formats
算子输入数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出Shapes
Output Shapes
算子的输出维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出数据类型
Output Data Types
算子输出数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
输出格式
Output Formats
算子输出数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。
算子属性信息
Attr Info
算子属性信息。采集数据时task-time配置为l0或l1时,不采集该字段,显示为N/A;只有开启aclnn,task-time配置为l2时,才有此字段。
参数
Args
算子的相关参数信息。
统计系统视图
在“系统视图”页签,当选择时,页面包含卡序号(Rank ID)选框、综合指标(Overall Metrics)、5种类型的算子汇总统计页签和算子详情(Kernel Details)(NPU上算子的详细信息),在卡序号选框中可以选择想要查看的卡。如果是db场景,需要依次选择“机器名称”和“卡序号”。
综合指标(Overall Metrics)展示所有算子的总体信息,如图3所示,字段解释如表3所示,当选择计算时间(Computing Time)列表中的子层级时,可单击“More”区域任一算子,会跳转到该算子在时间线视图中的具体位置。
5种算子类型包括Python API 汇总(Python API Summary)、CANN API 汇总(CANN API Summary)、Ascend HardWare Task 汇总(Ascend HardWare Task Summary)、通信汇总(Communication Summary)、覆盖分析(Overlap Analysis),算子信息如图4所示,字段解释如表4所示。
中文字段 |
英文字段 |
说明 |
|---|---|---|
名称 |
Name |
名称。 |
时间(%) |
Time(%) |
总时间占比 = 该类的耗时总时间 / 所有耗时总时间。 当统计类型为覆盖分析(Overlap Analysis)时,时间占比 = 该类的耗时总时间 /(Communication(Not Overlapped)总时间 + Computing总时间 + Free总时间)。 |
总时间(us) |
Total Time(us) |
该类耗时总和。 |
调用数 |
Num Calls |
被调用次数。 |
平均值(us) |
Avg(us) |
该类耗时的平均值。 |
最小值(us) |
Min(us) |
该类耗时的最小值。 |
最大值(us) |
Max(us) |
该类耗时的最大值。 |
算子详情(Kernel Details)展示NPU上算子的详细信息,如图5所示,字段解释如表5所示,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)将会展示选中详情,展示该算子的具体信息。单击算子详情表中字段名称后的
,可对相关字段进行模糊搜索。
中文字段 |
英文字段 |
说明 |
|---|---|---|
名称 |
Name |
算子名称。 |
类型 |
Type |
算子类型。 |
加速器核 |
Accelerator Core |
计算核类型。 |
开始时间 |
Start Time |
任务开始时间点。 |
时长(us) |
Duration(us) |
任务耗时。 |
等待时间(us) |
Wait Time(us) |
上一个任务的结束时间与当前任务的开始时间间隔,单位us。 |
任务ID |
Task ID |
任务的ID。 |
Block数量 |
Block Dim |
任务运行切分数量,对应任务运行时核数。 |
输入Shapes |
Input Shapes |
算子的输入维度。 |
输入数据类型 |
Input Data Types |
算子输入数据类型。 |
输入格式 |
Input Formats |
算子输入数据格式。 |
输出Shapes |
Output Shapes |
算子的输出维度。 |
输出数据类型 |
Output Data Types |
算子输出数据类型。 |
输出格式 |
Output Formats |
算子输出数据格式。 |
点击跳转Timeline |
Click To Timeline |
单击“点击”,跳转到算子在时间线视图上的具体位置,并且在区域四(数据窗格)展示该算子的详情。 |
专家系统视图
在“系统视图”页签,当选择时,页面包含卡序号选框、专家分析页签、6种类型专家建议系统页签,在卡序号选框中可以选择想要查看的卡。如果是db场景,需要依次选择“机器名称”和“卡序号”。
专家分析(Expert Analysis)页签展示泳道中的异常指标信息。
6种专家建议系统包括亲和 API(Affinity API)、亲和优化器(Affinity Optimizer)、AICPU 算子(AICPU Operators)、ACLNN 算子(ACLNN Operators)、算子融合(Operators Fusion)和算子下发(Operators Dispatch),如图6所示,字段解释如表6所示。
选择任一专家建议系统,右侧区域会显示该类专家建议系统的详细信息,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)“选中详情”页签将会展示该算子的具体信息。
中文字段 |
英文字段 |
说明 |
|---|---|---|
名称 |
Name |
算子名称。 当专家建议系统为亲和优化器(Affinity Optimizer)时无此参数。 |
原始API |
Origin API |
可融合API序列。 仅当专家建议系统为亲和 API(Affinity API)时存在。 |
替换API |
Replacement API |
等效亲和API。 仅当专家建议系统为亲和 API(Affinity API)时存在。 |
原始优化器 |
Origin Optimizer |
可融合优化器。 仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。 |
替换优化器 |
Replacement Optimizer |
可替换的优化器。 仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。 |
原始算子 |
Origin Operators |
可融合的算子。 仅当专家建议系统为算子融合(Operators Fusion)时存在。 |
融合算子 |
Fused Operator |
CANN层已融合的算子。 仅当专家建议系统为算子融合(Operators Fusion)时存在。 |
开始时间 |
Start Time |
任务开始时间点。 |
时长(us) |
Duration(us) |
任务耗时。 |
进程Id |
Process Id |
进程ID。 |
线程Id |
Thread Id |
线程ID。 |
备注 |
Notes |
提示信息。 当专家建议系统为亲和优化器(Affinity Optimizer)时无此参数。 |
点击跳转Timeline |
Click To Timeline |
单击“点击”,跳转到算子在时间线视图中的具体位置,并且在区域四(数据窗格)展示该算子的详情。 |
事件视图
在时间线(Timeline)界面,支持在事件视图中显示算子信息。
中文字段 |
英文字段 |
说明 |
|---|---|---|
名称 |
Name |
算子名称。 |
开始时间 |
Start |
算子执行开始时间。 |
时长(ns) |
Duration(ns) |
算子运行总耗时。 |
线程ID |
TID |
线程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
进程ID |
PID |
进程ID。 当选择Python和CANN泳道及其子泳道时存在。 |
任务流名称 |
Stream Name |
Ascend Hardware泳道下的Stream任务流名称。 仅当选择Ascend Hardware泳道及其子泳道时存在。 |
通信域名称 |
Group Name |
通信算子集群名称。 仅当选择Communication泳道及其Group子泳道时存在。 |
分析算子类型 |
Analysis Type |
分析算子类型。 仅当选择Overlap Analysis泳道及其子泳道时存在。 |
卡序号 |
Rank ID |
算子所在卡序号。 当选择Ascend Hardware、Communication和Overlap Analysis泳道及其子泳道时存在。 |
点击跳转Timeline |
Click To Timeline |
单击“click”,跳转到算子在时间线视图上的具体位置,并且在页签展示该算子的详情。 |
- Card层级不支持此功能。
- HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道不支持此功能。
- Communication泳道下的Plane子泳道不支持此功能。






