昇腾社区首页
中文
注册

AI core、AI cpu、All reduce并行度分析数据说明

请参见导出Job Profiling的timeline数据获取并行度分析数据文件task_time_{device_id}_{model_id}_{iter_id}.json,其中{device_id}表示设备ID,{model_id}表示某轮迭代的模型ID号,{iter_id}表示某轮迭代的ID号。

在Chrome浏览器中输入“chrome://tracing”地址,将json文件拖到空白处打开,通过键盘上的快捷键(w:放大 s:缩小 a:左移 d:右移)进行查看。

task_time_{device_id}_{model_id}_{iter_id}.json文件内容格式示例(示意图以选择AI CPU为例)如下:

关键字段说明参见表1

表1 字段说明

字段名

字段含义

Title

选择某个组件的接口名称。

Start

显示界面中时间轴上的时刻点,chrome trace自动对齐。

Wall Duration

表示当前接口调用耗时,单位ms。

AI CPU

compute_time(us):计算耗时,单位us。

memcpy_time(us):内存拷贝耗时,单位us。

task_time(us):Task任务耗时,单位us。

dispatch_time(us):分发耗时,单位us。

total_time(us):整个task的执行时间,单位us。

ALL REDUCE

Reduce Duration(us):集合通信时间,单位us。

TASK SCHEDULER

task_type:Task类型。

stream_id:对应的Stream ID。

task_id:对应的Task ID。

aicore_time(ms):该Task在AI Core上所有指令的总耗时,单位ms。

total_cycle:该Task在AI Core上所有指令的cycle总数。

Receive Time:内存复制的信息接收时间。仅MemcopyAsync接口展示。

Start Time:内存复制的开始时间。仅MemcopyAsync接口展示。

End Time:内存复制的结束时间。仅MemcopyAsync接口展示。