单算子耗时差异
单算子耗时差异可以通过性能比对工具,将GPU与NPU的数据进行比对。
- 采集数据。
- GPU数据:参见官方文档使用PyTorch原生接口采集GPU数据。
- NPU数据:通过Ascend PyTorch Profiler工具采集NPU的数据。
ASCEND_PROFILER_OUTPUT文件夹下有trace_view.json文件。
图1 采集目录图2 timeline文件
- 执行命令进行NPU与GPU数据对比。
python performance_compare.py [基准json文件的path] [比较json文件的path]
命令示例:
python performance_compare.py ./GPU.json ./NPU_trace_view.json
生成的结果文件:torch_op_compare_xx.csv
图3 结果文件文件中分别标记了NPU比GPU性能好的部分与差的部分,绿色标记代表性能好,红色标记代表性能差,可在“DIFF Filter”字段按照颜色选择查看算子差异的部分。
父主题: 识别算子性能点