aclopSetKernelArgs

产品支持情况

产品

是否支持

Atlas A2 训练系列产品/Atlas 800I A2 推理产品/A200I A2 Box 异构组件

Atlas 200I/500 A2 推理产品

Atlas 推理系列产品

Atlas 训练系列产品

Atlas 200/300/500 推理产品

功能说明

动态Shape场景下,设置算子Tiling参数、执行并发数。

函数原型

aclError aclopSetKernelArgs(aclopKernelDesc *kernelDesc,
const char *kernelId,
uint32_t blockDim,
const void *args,
uint32_t argSize)

参数说明

参数名

输入/输出

说明

kernelDesc

输入

Kernel描述缓存,aclopKernelDesc类型的指针。

typedef struct aclopKernelDesc aclopKernelDesc;

kernelId

输入

算子执行时要指定的Kernel ID的指针,与调用aclopCreateKernel时传递的kernelId一致。

blockDim

输入

Kernel执行的并发AI Core核数。

建议此处设置的blockDim和TIK算子实现时的使用的AI Core核数保持一致。

args

输入

Tiling参数的指针。

argSize

输入

Tiling参数内存大小,单位为Byte。

返回值说明

返回0表示成功,返回其他值表示失败,请参见aclError

参考资源

接口调用流程及示例,参见执行动态Shape算子示例代码(注册算子选择器)