run_profiling
函数功能
通用的Profiling运行接口。在NPU板端拉起kernel.o文件并灌入输入数据,打开Profiling运行算子逻辑,执行成功后将板端输出数据拷贝到Host侧,自动完成输出数据精度比对。
函数原型
def run_profiling(self, kernel_file: str, profiling_options: RunProfilingOptions, npu_compile_info: NpuCompileInfo = None, tiling_info: TilingInfo = None)
参数说明
| 参数名 | 输入/输出 | 说明 | 是否必设 | 
|---|---|---|---|
| kernel_file | 输入 | 核函数编译生成的.o文件。 | 是 | 
| profiling_options | 输入 | RunProfilingOptions的实例对象,用户根据实际情况自行设置。 | 是 | 
| npu_compile_info | 输入 | NpuCompileInfo的实例对象,用户根据kernel_file编译时的属性进行设置。 | 否 | 
| tiling_info | 输入 | TilingInfo的实例对象。 
 | 否 | 
返回值
无
使用说明
支持所有的工程算子开发场景,以标准自定义算子工程场景的调用为例,具体参见上板Profiling数据采集。
父主题: OpExecutor类