功能介绍
Profiling性能分析工具用于采集和分析运行在昇腾AI处理器上的推理业务(应用或算子)各个运行阶段的关键性能指标,用户可根据输出的性能数据针对关键性能瓶颈做出优化以实现产品的极致性能。
Profiling性能分析工具针对APP工程运行过程中的硬件和软件以及Host侧性能数据进行采集、分析并汇总展示:
- 硬件的性能数据包括:AI Core等模块的PMU指标及系统硬件性能指标。
- 软件的性能数据包括:AscendCL、GE、RTS等模块的性能指标数据。
- Host侧性能数据包括:CPU、Memory、Disk、Network、pthread和system call模块的性能指标数据。
Profiling还可以采集Host与Device之间、Device间的同步异步内存复制时延,在AscendCL和Runtime接口数据中体现。
父主题: Profiling简介