该数据可以从以下入口查看:
该数据在Chrome浏览器中展示示例如下:
关键字段说明如下。
字段名 |
字段含义 |
---|---|
Title |
选择某个组件的接口名称。 |
Start |
显示界面中时间轴上的时刻点,chrome trace自动对齐,单位ms。 |
Wall Duration |
表示当前接口调用耗时,单位ms。 |
AI CPU |
Task Time(us):Task任务耗时,单位us。 |
ALL REDUCE |
Reduce Duration(us):集合通信时间,单位us。 |
Task Type |
执行该Task的加速器类型,包含AI CORE、AI VECTOR CORE、AI CPU等。 |
Stream Id |
该Task所处的Stream ID。 |
Task Id |
对应的Task ID。 |
Subtask Id |
对应的Subtask ID。 |
Aicore Time(ms) |
当所有的Block被同时调度,且每个Block的执行时长相等时,该Task在AI Core上的理论执行时间,单位ms。通常情况下,不同的Block开始调度时间略有差距,故该字段值略小于Task在AI Core上的实际执行时间。手动调频、功耗超出默认功耗值时动态调频以及Atlas 300V/Atlas 300I Pro情况下该数据不准确,不建议参考。 |
Total Cycle |
该Task在AI Core上执行的cycle总数,由所有的Block的执行cycle数累加而成。 |
Receive Time |
Device收到内存拷贝Task的信息接收时间。仅MemcopyAsync接口展示。 |
Start Time |
内存拷贝Task开始拷贝的时间。仅MemcopyAsync接口展示。 |
End Time |
内存拷贝Task结束拷贝的时间。仅MemcopyAsync接口展示。 |