aclrtLaunchKernel
产品支持情况
产品 |
是否支持 |
---|---|
√ |
|
√ |
|
√ |
|
√ |
|
√ |
功能说明
启动对应算子的计算任务,异步接口。此处的算子为使用Ascend C语言开发的自定义算子。
函数原型
aclError aclrtLaunchKernel(aclrtFuncHandle funcHandle, uint32_t blockDim, const void *argsData, size_t argsSize, aclrtStream stream)
参数说明
参数名 |
输入/输出 |
说明 |
---|---|---|
funcHandle |
输入 |
调用aclrtBinaryGetFunction接口根据kernelName获取funcHandle。 |
blockDim |
输入 |
指定核函数将会在几个核上执行。 |
argsData |
输入 |
存放核函数所有入参数据的Device内存地址指针。 内存申请接口请参见内存管理。 注意,执行本接口下发任务的Device需与argsData中使用的Device内存要是同一个Device。 |
argsSize |
输入 |
argsData参数值的大小,单位为Byte。 |
stream |
输入 |
指定执行任务的Stream,可复用已创建的Stream节省资源或调用aclrtCreateStream接口创建Stream,再作为入参在此处传入。 |
返回值说明
返回0表示成功,返回其他值表示失败,请参见aclError。
参考资源
下表的几个接口都用于启用对应算子的计算任务,但功能和使用方式有所不同:
接口 |
核函数参数值的传入方式 |
核函数参数值的存放位置 |
是否可指定任务下发的配置信息 |
---|---|---|---|
在接口中指定存放核函数所有入参数据的Device内存地址指针 |
Device内存 |
否 |
|
在接口中指定参数列表句柄aclrtArgsHandle |
Host内存 |
是 |
父主题: Kernel加载与执行