昇腾社区首页
中文
注册

界面介绍

功能说明

详情(Details)界面用于展示算子基础信息、计算负载分析和内存负载分析,并以柱状图和数据窗格呈现方式显示分析结果。

界面展示

请参见导入数据章节导入msprof 采集的算子Profiling的bin文件,获取bin文件请参见算子工具使用指南中“工具使用”章节的“msprof op”内容。

只支持导入单个二进制bin文件,不支持以文件夹方式导入。

详情(Details)界面包含基础信息(Base Info)(区域一)、计算工作负载分析(Compute Workload Analysis)(区域二)和内存负载分析(Memory Workload Analysis)(区域三),如图1所示。

图1 详情界面
  • 区域一:基础信息(Base Info),可查看算子基础信息,包含名称、芯片、时长、类型等内容,参数详细说明如表1所示。
    表1 基本信息参数说明

    中文参数

    英文参数

    说明

    名称

    Name

    算子名称。

    芯片

    Soc

    算子运行平台。

    时长 (μs)

    Duration (μs)

    算子总耗时。

    算子类型

    Op Type

    算子类型。有mix、vector、cube和AiCore四种类型。

    Block数量

    Block Dim

    Sub Block的数量。当算子类型为vector、cube和AiCore时,为此参数名称。

    混合Block数量

    Mix Block Dim

    Sub Block的数量。当算子类型为mix时,为此参数名称。

    Block详情

    Block Detail

    Sub Block耗时详情。当算子类型为vector、cube和AiCore时,为此参数名称,其中字段解释如表2所示。

    混合Block详情

    Mix Block Detail

    Sub Block耗时详情。当算子类型为mix时,为此参数名称,其中字段解释如表3所示。

    表2 Block详情字段说明

    中文字段

    英文字段

    说明

    Block ID

    Block ID

    Sub Block序号。

    当算子类型为AiCore时,无此参数。

    计算核类型

    Core Type

    Sub Block类型。

    时长 (μs)

    Duration (μs)

    Sub Block耗时。

    表3 混合Block详情字段说明

    中文字段

    英文字段

    说明

    Block ID

    Block ID

    Sub Block序号。

    CUBE0 时长 (μs)

    CUBE0 Duration (μs)

    AI Core的cube核耗时。

    VECTOR0 时长 (μs)

    VECTOR0 Duration (μs)

    AI Core的其中一个vector核耗时。

    VECTOR1 时长 (μs)

    VECTOR1 Duration (μs)

    AI Core的另外一个vector核耗时。

  • 区域二:计算工作负载分析,以柱状图和数据窗格呈现方式查看相应信息,便于开发人员分析。如图2所示,参数详细说明如表4所示。
    图2 计算工作负载分析
    表4 计算工作负载分析参数说明

    中文参数

    英文参数

    说明

    Block ID

    Block ID

    Sub Block序号。可通过切换Block ID来查看对应信息。

    当算子类型为AiCore时,此参数显示NA,展示的是多核平均值。

    Pipe Utilization

    Pipe Utilization

    Pipe(指令队列)可视化,以柱状图方式展示。

    • 横坐标:Cycles占比,计算方式为Cycles/总的Cycles。Cycles为该指令在Sub Block上执行消耗的时钟周期。
    • 纵坐标:算子指令,由bin文件的数据中提供。

    CUBE

    CUBE

    cube类型的指令名称。当算子类型为cube时,显示此参数。

    CUBE0

    CUBE0

    cube类型的指令名称。当算子类型为mix时,显示此参数。

    VECTOR

    VECTOR

    vector类型的指令名称。当算子类型为vector和cube时,显示此参数。

    VECTOR0

    VECTOR0

    vector类型的指令名称。当算子类型为mix时,显示此参数。

    VECTOR1

    VECTOR1

    vector类型的指令名称。当算子类型为mix时,显示此参数。

    AICORE

    AICORE

    AiCore类型的指令名称。当算子类型为AiCore时,显示此参数。

    指令数

    Instructions

    算子指令数量。

    时长(μs)

    Duration(μs)

    算子指令耗时。

    数据搬运量(byte)

    Data Volume(byte)

    算子指令数据量。

  • 区域三:内存负载分析,以内存热力图和数据窗格呈现方式查看相应信息,如图3所示,参数配置如表5所示。热力图左侧的“Peak”为箭头颜色,值为峰值带占比(最大带宽占比)。
    图3 内存负载分析
    表5 参数配置

    中文参数

    英文参数

    说明

    Block ID

    Block ID

    Sub Block序号。在Block ID选框中可以选择想要查看的Sub Block。

    当算子类型为AiCore时,Block ID显示NA,展示的是多核平均值。

    显示为

    Show As

    可选项,选择热力图连线箭头内容以请求数或者带宽展示。热力图箭头代表流向。

    • 请求数(Num of Request)
    • 带宽(Bandwidth)

    数据窗格呈现内容随算子类型而变化,内容是bin文件的数据解析结果,具体呈现如下:

    • 当算子类型为AiCore时,表格窗格内容如表6所示。
      表6 AiCore类型

      中文参数

      英文参数

      说明

      Cache

      Cache

      L2缓存。

      Cube

      Cube

      cube计算单元。

      HBM

      HBM

      高带宽存储器单元。

      L0A

      L0A

      L0A储存单元。

      L0B

      L0B

      L0B储存单元。

      L0C

      L0C

      L0C储存单元。

      L1

      L1

      L1储存单元。

      Pipe

      Pipe

      计算通路。

      UB

      UB

      ub储存单元。

      Vector

      Vector

      vector计算单元。

      请求数

      Requests

      操作数量。

      吞吐量(GB/s)

      Throughput(GB/s)

      吞吐量,表示通路每秒的传输数据量,单位为 GB/s。

    • 当算子类型为mix时,表格窗格内容如表7所示。
      表7 mix类型

      中文参数

      英文参数

      说明

      Cache

      Cache

      L2缓存。

      命中次数

      Hit

      cache命中次数。

      未命中次数

      Miss

      cache未命中后重新分配缓存的次数。

      总次数

      Total

      cache请求总次数。

      命中率(%)

      Hit Rate(%)

      cache命中率。

      Cube

      Cube

      cube计算单元。

      HBM Cube

      HBM Cube

      cube单元的高带宽存储器单元。

      HBM Vector Core0

      HBM Vector Core0

      aicore内core0的vector单元的高带宽存储器单元。

      HBM Vector Core1

      HBM Vector Core1

      aicore内core1的vector单元的高带宽存储器单元。

      L0A

      L0A

      L0A储存单元。

      L0B

      L0B

      L0B储存单元。

      L0C

      L0C

      L0C储存单元。

      L1

      L1

      L1储存单元。

      请求数

      Requests

      操作数量。

      吞吐量(GB/s)

      Throughput(GB/s)

      吞吐量,表示通路每秒的传输数据量,单位为 GB/s。

      峰值(最大带宽占比)(%)

      Peak(%)

      与理论带宽的比率。

      Pipe Cube

      Pipe Cube

      cube单元的计算通路。

      Pipe Vector Core0

      Pipe Vector Core0

      aicore内core0的vector单元的计算通路。

      Pipe Vector Core1

      Pipe Vector Core1

      aicore内core1的vector单元的计算通路。

      指令数

      Instructions

      指令数量。

      时钟周期

      Cycle

      通路消耗的时钟周期。

      等待周期

      Wait Cycles

      对应pipe上被阻塞的cycle数。

      活跃率(%)

      Active Rate(%)

      运行cycle数占总的cycle的百分比。

      UB Core0

      UB Core0

      mix算子aicore内core0的ub储存单元。

      UB Core1

      UB Core1

      mix算子aicore内core1的ub储存单元。

      Vector

      Vector core0

      vector计算单元。

    • 当算子类型为vector时,表格窗格内容如表8所示。
      表8 vector类型

      中文参数

      英文参数

      说明

      Cache

      Cache

      L2缓存。

      命中次数

      Hit

      cache命中次数。

      未命中次数

      Miss

      cache未命中后重新分配缓存的次数。

      总次数

      Total

      cache请求总次数。

      命中率(%)

      Hit Rate(%)

      cache命中率。

      HBM

      HBM

      高带宽存储器单元。

      请求数

      Requests

      操作数量。

      吞吐量(GB/s)

      Throughput(GB/s)

      吞吐量,表示通路每秒的传输数据量,单位为 GB/s。

      Pipe

      Pipe

      计算通路。

      指令数

      Instructions

      指令数量。

      时钟周期

      Cycle

      通路消耗的时钟周期。

      等待周期

      Wait Cycles

      对应pipe上被阻塞的cycle数。

      活跃率(%)

      Active Rate(%)

      运行cycle数占总的cycle的百分比。

      UB

      UB

      ub储存单元。

      Vector

      Vector

      vector计算单元。

      峰值(最大带宽占比)(%)

      Peak(%)

      与理论带宽的比率。

    • 当算子类型为cube时,表格窗格内容如表9所示。
      表9 cube类型

      中文参数

      英文参数

      说明

      Cache

      Cache

      L2缓存。

      命中次数

      Hit

      cache命中次数。

      未命中次数

      Miss

      cache未命中后重新分配缓存的次数。

      总次数

      Total

      cache请求总次数。

      命中率(%)

      Hit Rate(%)

      cache命中率。

      Cube

      Cube

      cube计算单元。

      HBM

      HBM

      高带宽存储器单元。

      L0A

      L0A

      L0A储存单元。

      L0B

      L0B

      L0B储存单元。

      L0C

      L0C

      L0C储存单元。

      L1

      L1

      L1储存单元。

      请求数

      Requests

      操作数量。

      吞吐量(GB/s)

      Throughput(GB/s)

      吞吐量,表示通路每秒的传输数据量,单位为 GB/s。

      峰值(最大带宽占比)(%)

      Peak(%)

      与理论带宽的比率。

      Pipe

      Pipe

      计算通路。

      指令数

      Instructions

      指令数量。

      时钟周期

      Cycle

      通路消耗的时钟周期。

      等待周期

      Wait Cycles

      对应pipe上被阻塞的cycle数。

      活跃率(%)

      Active Rate(%)

      运行cycle数占总的cycle的百分比。