Data Preparation

Data Preparation数据准备性能分析。

  • 仅支持集群训练场景的数据准备过程进行性能分析。
  • MindStudio不支持集群场景的数据采集,可通过Import Result导入已采集的PROF_XXX的父目录来展示集群场景性能数据。

数据准备过程可以分为三个阶段:数据处理pipeline、训练数据发送至Device以及Device侧读取训练数据。数据准备过程中,MindStudio性能分析工具通过迭代间隙的识别,实现了训练数据发送至Device以及Device侧读取训练数据两个阶段的性能瓶颈分析。

图1所示为数据下沉模式,包含Host Queues(主机队列图)、Data Queues(数据队列图)、Host Data Transmission(主机数据发送图)和Data Acquisition(取数据算子耗时图)。

图2所示为非数据下沉模式,只包含Host Queues(主机队列图)。

图1 数据下沉模式
图2 非数据下沉模式

图中各字段说明如表1所示。

表1 字段说明

字段

说明

Rank ID

集群场景的节点ID。

Apply

数据导出按钮。当选择某个Rank ID并单击该按钮时,导出该节点的Data Preparation。

Queues Analysis

Host Queues

主机队列图。

Data Queues

数据队列图。

Proportion of Empty Queues: */*

队列为空比例:空队列数/总队列数。为主机和数据队列图横纵坐标信息的汇总值。

Iteration

迭代。

Queue size

队列个数。

Consumption Analysis

Host Data Transmission

主机数据发送图。

Average Duration: *ms

平均总耗时,单位为ms。取主机数据发送图横纵坐标信息的汇总后的平均值。

Average Data Acquisition Duration: *ms

平均取数据耗时,单位为ms。

Average Data Sending Duration: *ms

平均推送数据耗时,单位为ms。

Total duration

总耗时。取主机数据发送图横纵坐标信息的汇总。

Data acquisition duration

取数据耗时。

Data sending duration

推送数据耗时。

Data Acquisition

取数据算子耗时图。

Average Duration: *ms

平均总耗时,单位为ms。为取数据算子耗时图横纵坐标信息的汇总后的平均值。

Iteration

迭代。

Time(ms)

耗时。