概述

PyTorch profiling功能是继承自原生PyTorch的功能,主要记录了PyTorch框架层面的算子耗时信息。

CANN profiling则是仅针对CANN层内算子执行流程来记录性能信息,主要功能是分析算子在NPU设备上的执行性能,可以清晰看出算子在不同shape/format下耗时信息。