Data Preparation数据准备性能分析。
数据准备过程可以分为三个阶段:数据处理pipeline、训练数据发送至Device以及Device侧读取训练数据。数据准备过程中,MindStudio性能分析工具通过迭代间隙的识别,实现了训练数据发送至Device以及Device侧读取训练数据两个阶段的性能瓶颈分析。
如图1所示为数据下沉模式,包含Host Queues(主机队列图)、Data Queues(数据队列图)、Host Data Transmission(主机数据发送图)和Data Acquisition(取数据算子耗时图)。
如图2所示为非数据下沉模式,只包含Host Queues(主机队列图)。
图中各字段说明如表1所示。
字段 |
说明 |
---|---|
Rank ID |
集群场景的节点ID。 |
Apply |
数据导出按钮。当选择某个Rank ID并单击该按钮时,导出该节点的Data Preparation。 |
Queues Analysis |
|
Host Queues |
主机队列图。 |
Data Queues |
数据队列图。 |
Proportion of Empty Queues: */* |
队列为空比例:空队列数/总队列数。为主机和数据队列图横纵坐标信息的汇总值。 |
Iteration |
迭代。 |
Queue size |
队列个数。 |
Consumption Analysis |
|
Host Data Transmission |
主机数据发送图。 |
Average Duration: *ms |
平均总耗时,单位为ms。取主机数据发送图横纵坐标信息的汇总后的平均值。 |
Average Data Acquisition Duration: *ms |
平均取数据耗时,单位为ms。 |
Average Data Sending Duration: *ms |
平均推送数据耗时,单位为ms。 |
Total duration |
总耗时。取主机数据发送图横纵坐标信息的汇总。 |
Data acquisition duration |
取数据耗时。 |
Data sending duration |
推送数据耗时。 |
Data Acquisition |
取数据算子耗时图。 |
Average Duration: *ms |
平均总耗时,单位为ms。为取数据算子耗时图横纵坐标信息的汇总后的平均值。 |
Iteration |
迭代。 |
Time(ms) |
耗时。 |