AI core、AI cpu、All reduce并行度分析数据说明
请参见导出Job Profiling的timeline数据获取并行度分析数据文件task_time_{device_id}_{model_id}_{iter_id}.json,其中{device_id}表示设备ID,{model_id}表示某轮迭代的模型ID号,{iter_id}表示某轮迭代的ID号。
在Chrome浏览器中输入“chrome://tracing”地址,将json文件拖到空白处打开,通过键盘上的快捷键(w:放大 s:缩小 a:左移 d:右移)进行查看。
task_time_{device_id}_{model_id}_{iter_id}.json文件内容格式示例(示意图以选择AI CPU为例)如下:
关键字段说明参见表1:
字段名 |
字段含义 |
---|---|
Title |
选择某个组件的接口名称。 |
Start |
显示界面中时间轴上的时刻点,chrome trace自动对齐。 |
Wall Duration |
表示当前接口调用耗时,单位ms。 |
AI CPU |
compute_time(us):计算耗时,单位us。 |
memcpy_time(us):内存拷贝耗时,单位us。 |
|
task_time(us):Task任务耗时,单位us。 |
|
dispatch_time(us):分发耗时,单位us。 |
|
total_time(us):整个task的执行时间,单位us。 |
|
ALL REDUCE |
Reduce Duration(us):集合通信时间,单位us。 |
TASK SCHEDULER |
task_type:Task类型。 |
stream_id:对应的Stream ID。 |
|
task_id:对应的Task ID。 |
|
aicore_time(ms):该Task在AI Core上所有指令的总耗时,单位ms。 |
|
total_cycle:该Task在AI Core上所有指令的cycle总数。 |
|
Receive Time:内存复制的信息接收时间。仅MemcopyAsync接口展示。 |
|
Start Time:内存复制的开始时间。仅MemcopyAsync接口展示。 |
|
End Time:内存复制的结束时间。仅MemcopyAsync接口展示。 |