昇腾社区首页
中文
注册

界面介绍

功能说明

在算子性能调优过程中,MindStudio Insight工具以时间线(Timeline)的呈现方式,将算子运行过程中,底层指令的详细执行情况平铺在时间轴上,直观呈现AI处理器每个Core上的每个Pipe中指令的调用顺序和耗时情况。通过分析时间线,用户可以通过查看指令详情、指令耗时等信息快速定位出性能瓶颈。

界面展示

时间线(Timeline)界面包含工具栏(区域一)、图形化展示(区域二)和数据窗格(区域三)三个部分组成,如图1所示。
图1 时间线界面
  • 区域一:工具栏,包含常用快捷按钮,从左至右依次为标记列表、过滤(支持按卡或按泳道过滤展示)、搜索、连线事件、重置缩放(页面复原)和时间轴缩小放大按钮。
  • 区域二:图形化展示,左侧显示各Core的分层信息,一层级为Core,二层级为Pipe。右侧为时间线视图,逐行对时间线进行图形化展现,包括各指令执行序列和执行时长。具体泳道信息请参见表1
  • 区域三:数据窗格,统计信息或指令详情信息展示区,选中详情(Slice Detail)为选中单个指令的详细信息、选中列表(Slice List)为某一泳道选中区域的指令列表信息。
    表1 泳道信息

    泳道名称

    说明

    ALL

    表示在这个通道的指令在所有通道都执行。

    SCALAR

    标量运算单元。

    FLOWCTRL

    控制流指令。

    MTE1

    数据搬运流水,数据搬运方向为:L1 ->{L0A/L0B, UBUF}。

    CUBE

    矩阵乘运算单元。

    FIXP

    数据搬运流水,数据搬运方向为:FIXPIPE L0C -> OUT/L1。

    Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件导出的性能数据支持展示。

    MTE2

    数据搬运流水,数据搬运方向为:{DDR/GM, L2} ->{L1, L0A/B, UBUF}。

    VECTOR

    向量运算单元。

    MTE3

    数据搬运流水,数据搬运方向为:UBUF -> {DDR/GM, L2, L1}、L1->{DDR/L2}。

    CACHEMISS

    未命中ICACHE。

    USEMASK

    自定义打点范围。

    MTE Throughput

    内存吞吐率信息。

    • GM_TO_L1:GM往L1搬运的数据吞吐率。
    • GM_TO_TOTAL:GM输出总数据吞吐率。
    • GM_TO_UB:GM往UB搬运的数据吞吐率。
    • L1_TO_GM:L1往GM搬运的数据吞吐率。
    • TOTAL_TO_GM:GM输入总数据吞吐率。
    • UB_TO_GM:UB往GM搬运的数据吞吐率。

通过观察时间线视图各个层级上的耗时长短、间隙等判断对应指令和Pipe是否存在性能问题,如指令执行是否存在瓶颈、是否存在高耗时的指令等。