aclnnTake

支持的产品型号

每个算子分为，必须先调用“aclnnTakeGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnTake”接口执行计算。

aclnnStatus aclnnTakeGetWorkspaceSize(const aclTensor *self, const aclTensor *index, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
aclnnStatus aclnnTake(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, const aclrtStream stream)

out_{i} = self_{index[i]}

参数说明

self(aclTensor*, 计算输入): Device侧的aclTensor，数据类型支持 UINT64、INT64、UINT32、FLOAT32、INT32、UINT16、INT16、FLOAT16、BFLOAT16（仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持）、INT8、UINT8、DOUBLE、COMPLEX64、COMPLEX128、BOOL，支持，支持ND，数据维度支持高于8维的场景。
index(aclTensor*, 计算输入): Device侧的aclTensor，数据类型支持INT32、INT64。支持，数据维度不高于8，为ND，支持负索引。
out(aclTensor*, 计算输出): Device侧的aclTensor，数据类型同self，数据类型支持 UINT64、INT64、UINT32、FLOAT32、INT32、UINT16、INT16、FLOAT16、BFLOAT16（仅Atlas A2训练系列产品/Atlas 800I A2推理产品支持）、INT8、UINT8、DOUBLE、COMPLEX64、COMPLEX128、BOOL，shape与index一致，支持，为ND。
workspaceSize(uint64_t*, 出参): 返回用户需要在Device侧申请的workspace大小。
executor(aclOpExecutor**, 出参): 返回op执行器，包含了算子计算流程计算流程。

返回值：

[object Object]

参数说明：

workspace(void*, 入参)：在Device侧申请的workspace内存地址。
workspaceSize(uint64_t, 入参)：在Device侧申请的workspace大小，由第一段接口aclnnTakeGetWorkspaceSize获取。
executor(aclOpExecutor*, 入参)：op执行器，包含了算子计算流程。
stream(aclrtStream, 入参)：指定执行任务的 AscendCL Stream流。

返回值：

aclnnStatus：返回状态码，具体参见。

无。

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]