精度预检
前提条件
完成精度数据采集,得到NPU环境的精度数据。
执行预检
- 将NPU环境下dump的精度数据拷贝至GPU环境。
- 分别在GPU和NPU环境下使用run_ut命令执行预检操作。(预检场景GPU环境需要使用NPU环境拷贝的精度数据)
msprobe -f pytorch run_ut -api_info ./dump_data/step0/rank/dump.json
出现Successfully completed run_ut/multi_run_ut日志表示预检完成,此时执行路径会生成两个csv文件,分别为accuracy_checking_details_{timestamp}.csv和accuracy_checking_result_{timestamp}.csv,这两个文件是NPU或GPU分别与CPU比对的结果。该结果为预检的中间结果,需要完成下一步,才能得到预检的最终结果。
图1 预检结果 - 将NPU和GPU的预检结果进行比对,查看NPU中是否存在精度问题的API。
- 预检结果分析。
api_precision_compare会在./compare_result/accuracy_checking目录下生成两个csv文件,如下:
父主题: 模型精度调试