昇腾社区首页
中文
注册

界面介绍

功能说明

在服务化调优过程中,MindStudio Insight工具以时间线(Timeline)的呈现方式,将请求端到端的执行情况平铺在时间轴上,直观体现请求在各个关键阶段的耗时情况以及当下请求的状态信息。通过分析时间线,用户可以快速识别服务化性能瓶颈,并根据问题现象,调整调优策略。

界面展示

时间线(Timeline)界面包含工具栏(区域一)、图形化展示(区域二)和数据窗格(区域三)三个部分组成,如图1所示。
图1 时间线界面
  • 区域一:工具栏,包含常用快捷按钮,从左至右依次为标记列表、过滤(支持按卡或按泳道过滤展示)、搜索、连线事件、重置缩放(页面复原)和时间轴缩小放大按钮。
  • 区域二:图形化展示,左侧显示服务化采集的性能数据,一层级为进程,二层级为请求的各个关键阶段信息,具体泳道信息如表1所示。右侧为时间线视图,逐行对时间线进行图形化展现,包括各关键阶段执行序列和执行时长。
    表1 泳道信息

    泳道名称

    说明

    CPU Usage

    CPU平均利用率。

    Memory Usage

    Host侧系统内存使用率。

    NPU Usage

    NPU内存占用。

    KVCache

    显存中block的数量,分配block的时刻,单位ns。

    BatchSchedule

    组batch时间,单位ns。

    WAITING

    batch进入WAITING状态的时刻。

    PENDING

    batch进入PENDING状态的时刻。

    RUNNING

    batch进入RUNNING状态的时刻。

    SWAPPED

    batch进入SWAPPED状态的时刻。

    RECOMPUTE

    batch进入RECOMPUTE状态的时刻。

    SUSPENDED

    batch进入SUSPENDED状态的时刻。

    END

    batch进入END状态的时刻。

    STOP

    batch进入STOP状态的时刻。

    PREFILL_HOLD

    batch进入PREFILL_HOLD状态的时刻。

    http

    请求发出或返回时刻。

    Queue

    请求入队或出队时刻。

    modelExec

    模型执行时间,单位ns。

    Tokenizer

    记录模型输入的tokenizer的encode和输出的decode的时间信息。

    PDcommunication

    PD分离通信时间,单位ns。(仅在PD分离场景下存在该泳道)

    forward

    模型推理前向传播时间,单位ns。

    postprocess

    模型推理后处理时间,单位ns。

    preprocess

    模型推理前处理时间,单位ns。

    PullKVCache

    PD节点之间的KVCache传输时间,单位ns。(仅在PD分离场景

    下存在该泳道)

    CANN

    算子执行时间,单位ns。

  • 区域三:数据窗格,统计信息或指令详情信息展示区,选中详情(Slice Detail)为选中单个关键阶段的详细信息、选中列表(Slice List)为泳道选中区域的关键阶段列表信息。

通过观察时间线视图各个层级上的耗时长短、间隙等判断对应的关键阶段是否存在性能问题。