昇腾社区首页
中文
注册

系统功能展示

统计信息

MindStudio Insight支持算子统计信息和单个算子详情信息查看。

  • 使用鼠标左键在单个三层级泳道上框选部分算子,或在单卡层级下跨多个泳道框选部分算子,框选部分区域算子后,可在下方“选中列表”页签中显示算子的统计信息,如图1所示,字段解释如表1所示。

    在单卡下跨多个泳道框选算子的情况下,HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道的框选部分不会在“选中列表”中统计。

    单击“选中列表”列中的某个算子,在右侧“More”列表中将会显示此区域中与该算子同名的所有算子,单击“More”列表中某一行,则在时间线视图中定位出该算子的具体位置,并同时跳转至“选中详情”页面,可查看该算子的详情信息。
    图1 选中列表
    表1 选中列表字段说明

    中文字段

    英文字段

    说明

    名称

    Name

    算子名称。

    持续时间

    Wall Duration

    算子执行总耗时。

    自用时间

    Self Time

    算子执行时间(不包括调用的子算子时间)。

    平均持续时间

    Average Wall Duration

    算子平均执行时间。

    发生次数

    Occurrences

    算子调用次数。

    索引

    Index

    序号。

    时间戳

    Timestamp

    在图形化窗格中的时间戳。

    时长(ns)

    Duration(ns)

    执行耗时。

  • 当选中单个算子时,可在下方“选中详情”页签中显示该算子的详情信息,如图2所示,字段解释如表2所示。
    图2 选中详情
    表2 选中详情字段说明

    中文字段

    英文字段

    说明

    标题

    Title

    名称。

    开始

    Start

    起始时间。

    持续时间

    Wall Duration

    总耗时。

    自用时间

    Self Time

    总耗时(不包括子类)。

    输入Shapes

    Input Shapes

    算子输入维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    输入数据类型

    Input Data Types

    算子输入数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    输入格式

    Input Formats

    算子输入数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    输出Shapes

    Output Shapes

    算子的输出维度。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    输出数据类型

    Output Data Types

    算子输出数据类型。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    输出格式

    Output Formats

    算子输出数据格式。采集数据时task-time配置为l0时,不采集该字段,显示为N/A;NPU加速核上采集到的算子才有此字段。

    算子属性信息

    Attr Info

    算子属性信息。采集数据时task-time配置为l0或l1时,不采集该字段,显示为N/A;只有开启aclnn,task-time配置为l2时,才有此该字段。

    参数

    Args

    算子的相关参数信息。

统计系统视图

“系统视图”页签,当选择统计系统视图时,页面包含卡序号(Rank ID)选框、5种类型的算子汇总统计页签和算子详情(Kernel Details)(NPU上算子的详细信息),在卡序号选框中可以选择想要查看的卡。

5种算子类型包括Python API 汇总(Python API Summary)、CANN API 汇总(CANN API Summary)、Ascend HardWare Task 汇总(Ascend HardWare Task Summary)、HCCL 汇总(HCCL Summary)、覆盖分析(Overlap Analysis),算子信息如图3所示,字段解释如表3所示。

图3 算子汇总页签
表3 统计系统视图字段说明

中文字段

英文字段

说明

名称

Name

名称。

时间(%)

Time(%)

总时间占比 = 该类的耗时总时间 / 所有耗时总时间。

当统计类型为覆盖分析(Overlap Analysis)时,时间占比 = 该类的耗时总时间 /(Communication(Not Overlapped)总时间 + Computing总时间 + Free总时间)。

总时间(us)

Total Time(us)

该类耗时总和。

调用数

Num Calls

被调用次数。

平均值(us)

Avg(us)

该类耗时的平均值。

最小值(us)

Min(us)

该类耗时的最小值。

最大值(us)

Max(us)

该类耗时的最大值。

算子详情(Kernel Details)展示NPU上算子的详细信息,如图4所示,字段解释如表4所示,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)将会展示选中详情,展示该算子的具体信息。单击算子详情表中字段名称后的,可对相关字段进行模糊搜索。

图4 算子详情信息展示
表4 算子详情字段说明

中文字段

英文字段

说明

名称

Name

算子名称。

类型

Type

算子类型。

加速器核

Accelerator Core

计算核类型。

开始时间

Start Time

任务开始时间点。

时长(us)

Duration(us)

任务耗时。

等待时间(us)

Wait Time(us)

上一个任务的结束时间与当前任务的开始时间间隔,单位us

Block数量

Block Dim

任务运行切分数量,对应任务运行时核数。

输入Shapes

Input Shapes

算子的输入维度。

输入数据类型

Input Data Types

算子输入数据类型。

输入格式

Input Formats

算子输入数据格式。

输出Shapes

Output Shapes

算子的输出维度。

输出数据类型

Output Data Types

算子输出数据类型。

输出格式

Output Formats

算子输出数据格式。

点击跳转Timeline

Click To Timeline

单击“点击”,跳转到算子在时间线视图上的具体位置,并且在区域四(数据窗格)展示该算子的详情。

专家系统视图

“系统视图”页签,当选择专家系统视图时,页面包含卡序号选框、5种类型专家建议系统页签,在卡序号选框中可以选择想要查看的卡。

5种专家建议系统包括亲和 API(Affinity API)、亲和优化器(Affinity Optimizer)、AICPU 算子(AICPU Operators)、ACLNN 算子(ACLNN Operators)、算子融合(Operators Fusion),如图5所示,字段解释如表5所示。

选择任一专家建议系统,右侧区域会显示该类专家建议系统的详细信息,单击“点击跳转Timeline”列中的“点击”,会跳转到算子在时间线视图中的具体位置,区域四(数据窗格)“选中详情”页签将会展示该算子的具体信息。

图5 专家系统视图
表5 专家系统视图字段说明

中文字段

英文字段

说明

名称

Name

算子名称。

当专家建议系统为亲和优化器(Affinity Optimizer)时无此参数。

原始API

Origin API

可融合API序列。

仅当专家建议系统为亲和 API(Affinity API)时存在。

替换API

Replacement API

等效亲和API。

仅当专家建议系统为亲和 API(Affinity API)时存在。

原始优化器

Origin Optimizer

可融合优化器。

仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。

替换优化器

Replacement Optimizer

可替换的优化器。

仅当专家建议系统为亲和优化器(Affinity Optimizer)时存在。

原始算子

Origin Operators

可融合的算子。

仅当专家建议系统为算子融合(Operators Fusion)时存在。

融合算子

Fused Operator

CANN层已融合的算子。

仅当专家建议系统为算子融合(Operators Fusion)时存在。

开始时间

Start Time

任务开始时间点。

时长(us)

Duration(us)

任务耗时。

进程Id

Process Id

进程id。

线程Id

Thread Id

线程id。

备注

Notes

提示信息。

当专家建议系统为Affinity Optimizer时无此参数。

点击跳转Timeline

Click To Timeline

单击“点击”,跳转到算子在时间线视图中的具体位置,并且在区域四(数据窗格)展示该算子的详情。

事件视图

在时间线(Timeline)界面,支持在事件视图中显示算子信息。

在时间线(Timeline)界面,选择所需泳道,单击鼠标右键,单击在事件视图中显示菜单,跳转至“系统视图”页签,左侧区域选项默认选择事件视图,右侧区域显示该泳道所有算子详情,如图6所示,字段解释如表6所示。
图6 事件视图
表6 事件视图字段说明

中文字段

英文字段

说明

名称

Name

算子名称。

开始时间

Start

算子执开始时间。

时长(ns)

Duration(ns)

算子运行总耗时。

线程ID

TID

线程ID。

当选择Python和CANN泳道及其子泳道时存在。

进程ID

PID

进程ID。

当选择Python和CANN泳道及其子泳道时存在。

任务流名称

Stream Name

Ascend Hardware泳道下的Stream任务流名称。

仅当选择Ascend Hardware泳道及其子泳道时存在。

通信域名称

Group Name

通信算子集群名称。

仅当选择HCCL泳道及其Group子泳道时存在。

分析算子类型

Analysis Type

分析算子类型。

仅当选择Overlap Analysis泳道及其子泳道时存在。

卡序号

Rank ID

算子所在卡序号。

当选择Ascend Hardware、HCCL和Overlap Analysis泳道及其子泳道时存在。

点击跳转Timeline

Click To Timeline

单击“click”,跳转到算子在时间线视图上的具体位置,并且在Slice Detail页签展示该算子的详情。

  • Card层级不支持此功能。
  • HBM、LLC、NPU_MEM、Stars Soc Info、acc_pmu等直方图泳道不支持此功能。
  • HCCL泳道下的Plane子泳道不支持此功能。