timeline数据

msproftx timeline数据

msprof_tx timeline数据文件为msprof_tx.json。

msprof_tx.json在Chrome浏览器中展示如下。

图1 msprof_tx timeline数据展示
图2 PyTorch框架下E2E Profiling场景call_stack数据展示
关键字段说明如下。
表1 字段说明

字段名

字段含义

Title

选择某个组件的接口名称。

Start

显示界面中时间轴上的时刻点,chrome trace自动对齐,单位ms。

Wall Duration

表示当前接口调用耗时,单位ms。

Self Time

表示当前接口本身执行耗时,单位ms。

Category

Profiling msproftx采集进程类别,用于标识msproftx采集进程的采集内容。(预留字段,暂未开放)

Payload_type

Profiling msproftx采集进程中携带额外的信息Payload的数据类型。(预留字段,暂未开放)

Payload_value

Profiling msproftx采集进程中携带额外的信息Payload的指针。(预留字段,暂未开放)

Message_type

Profiling msproftx采集进程中携带字符串类型。(预留字段,暂未开放)

event_type

事件类型。

call_stack

call_stack调用栈数据信息。仅PyTorch训练场景E2E Profiling采集后展示。

PyTorch E2E Profiling场景采集msproftx下的call_stack数据,需在PyTorch训练脚本内设置“use_e2e_profiler=True”“TORCH_CALL_STACK=True”,详情请参见PyTorch模型迁移和训练指南“性能调优 > Profiling数据采集及分析 > E2E Profiling数据采集与分析”章节。

msproftx timeline数据(PyTorch E2E Profiling场景)

PyTorch框架下E2E Profiling场景的msprof_tx timeline数据文件为task_queue.json。

task_queue.json在Chrome浏览器中展示如下。

图3 PyTorch E2E Profiling场景数据展示

关键字段说明如下。

表2 字段说明

字段名

字段含义

Enqueue

PyTorch Adapter算子异步下发的task queue队列中算子入队(下发)时间。

Dequeue

PyTorch Adapter算子异步下发的task queue队列中算子出队(执行)时间。

  • 需要结合timeline目录汇总数据分析task queue是否存在性能问题。
  • PyTorch E2E Profiling场景采集msproftx数据,需在PyTorch训练脚本内设置“use_e2e_profiler=True”,详情请参见PyTorch模型迁移和训练指南“性能调优 > Profiling数据采集及分析 > E2E Profiling数据采集与分析”章节。