本节提供的调试方法基于核函数运行验证章节中的算子程序进行调试,请先完成核函数运行验证章节的学习。
基于NPU域算子的调用接口(<<<>>>内核调用符)编写的算子程序,通过毕昇编译器编译后生成可执行程序,运行可执行程序,可以完成算子NPU域的运行验证。使用性能采集工具运行NPU模式下生成的可执行文件从而采集Ascend C算子在AI处理器上执行的性能数据,进行性能精细调优。性能分析工具的具体使用方法请参考《性能分析工具使用指南》。