昇腾社区首页
中文
注册

界面介绍

功能说明

在NPU性能调优过程中,MindStudio Insight工具以时间线(Timeline)的呈现方式为用户提供全流程在线推理/训练过程中的运行情况,并按照调度流程来呈现整体的运行状况,并且MindStudio Insight支持集群时间线(Timeline)展示。通过分析时间线(Timeline),用户可以对在线推理/训练过程进行细粒度的分析,如迭代间隙是否过长、算子执行时间等,并提供一些易用性功能辅助用户快速定位出性能瓶颈。

界面展示

时间线(Timeline)界面包含工具栏(区域一)、时间线树状图(区域二)、图形化窗格(区域三)和数据窗格(区域四)四个部分组成,如图1所示。
图1 时间线界面
  • 区域一:工具栏,包含常用快捷按钮,从左至右依次为列表标记、过滤(支持按卡或按专项层过滤展示)、算子搜索、算子连线、页面自适应和缩放按钮。
  • 区域二:时间线树状图,TEXT场景和DB场景显示会有所不同。
    • TEXT场景:显示集群场景下各“Card”的分层信息,一层级为“Card”,二层级为进程或专项分层,三层级为线程等名称。二层级包括Python层数据(包含PyTorch和打点数据的耗时信息)、CANN层数据(包含AscendCL、GE和Runtime组件的耗时数据)、底层NPU数据(包含Ascend Hardware下各个Stream任务流的耗时数据和迭代轨迹数据、HCCL和Overlap Analysis通信数据以及其他昇腾AI处理器系统数据)和AI Core Freq等层级,层级内容展示随导入的数据而变化。
    • DB场景:显示各机器下的信息,一层级为机器名称,二层级为Host和“Card”。Host层级是按照进程与线程级维度展示Pytorch和CANN的数据;“Card”层级包括底层NPU数据(包含Ascend Hardware下各个Stream任务流的耗时数据和迭代轨迹数据、HCCL和Overlap Analysis通信数据以及其他昇腾AI处理器系统数据)和AI Core Freq等层级,且卡下属层级内容的展示随导入的数据而变化。

      Atlas A2 训练系列产品导出的性能数据才支持展示AI Core Freq数据。

  • 区域三:图形化窗格,展示的数据是迭代内的数据,图形化窗格对应时间线树状图,逐行对时间线进行图形化展现,包括上层应用算子、各组件及接口的执行序列和执行时长。
  • 区域四:数据窗格,统计信息或算子详情信息展示区,选中详情(Slice Detail)为选中单个算子的详细信息、选中列表(Slice List)为某一泳道选中区域的算子列表信息、以及系统视图(System View)为某类算子的汇总信息。

    通过观察时间线(Timeline)各个层级上的耗时长短、间隙等判断对应组件和算子是否存在性能问题,如算子下发是否存在瓶颈、是否存在高耗时的kernel以及是否存在冗余的转换类算子。