昇腾社区首页
中文
注册

函数:launch_kernel

C函数原型

aclError aclrtLaunchKernel(aclrtFuncHandle funcHandle, uint32_t blockDim, const void *argsData, size_t argsSize, aclrtStream stream)

Python函数

ret = acl.rt.launch_kernel(funcHandle, blockDim, argsData, argsSize, stream)

函数功能

启动对应Kernel的计算任务。仅支持Ascend C自定义算子。

输入说明

  • funcHandle:调用acl.rt.binary_get_function接口根据kernelName获取funcHandle。
  • blockDim:指定核函数将会在几个核上执行。
  • argsData:存放Kernel所有入参数据的Device内存地址指针。内存申请接口请参见内存管理
  • argsSize:argsData参数值的大小,单位为Byte。
  • stream:指定执行任务的Stream,可复用已创建的Stream节省资源或调用acl.rt.create_stream接口创建Stream,再作为入参在此处传入。

返回值说明

返回0表示成功,返回其他值表示失败。

约束说明

该接口是异步接口,调用接口成功仅表示任务下发成功,不表示任务执行成功。调用该接口后,需调用同步等待接口(例如,acl.rt.synchronize_stream)确保任务已执行完成。