单算子耗时差异

单算子耗时差异可以通过性能比对工具,将GPU与NPU的数据进行比对。

  1. 采集数据。

    • GPU数据:参见官方文档使用PyTorch原生接口采集GPU数据。
    • NPU数据:通过Ascend PyTorch Profiler工具采集NPU的数据。

      ASCEND_PROFILER_OUTPUT文件夹下有trace_view.json文件。

      图1 采集目录
      图2 timeline文件

  2. 执行命令进行NPU与GPU数据对比。

    python performance_compare.py  [基准json文件的path]    [比较json文件的path]    

    命令示例:

    python performance_compare.py ./GPU.json ./NPU_trace_view.json

    生成的结果文件:torch_op_compare_xx.csv

    图3 结果文件

    文件中分别标记了NPU比GPU性能好的部分与差的部分,绿色标记代表性能好,红色标记代表性能差,可在“DIFF Filter”字段按照颜色选择查看算子差异的部分。