昇腾社区首页
中文
注册

aclnnScatterNd

支持的产品型号

  • Atlas 推理系列产品
  • Atlas 训练系列产品
  • Atlas A2训练系列产品

接口原型

每个算子分为两段式接口,必须先调用“aclnnScatterNdGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnScatterNd”接口执行计算。

  • aclnnstatus aclnnScatterNdGetWorkspaceSize(const aclTensor *data,const aclTensor *indices,const aclTensor *updates, aclTensor *out, uint64_t *workspaceSize, aclOpExecutor **executor)
  • aclnnstatus aclnnScatterNd(void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream)

功能描述

算子功能:创建data的拷贝,同时在指定indices处根据updates更新。 计算公式:

[object Object]

aclnnScatterNdGetWorkspaceSize

  • 参数说明:

    • data(const aclTensor*,计算输入):含义说明,公式中的data,Device侧的aclTensor,数据类型支持FLOAT16, FLOAT, BOOL, BFLOAT16(仅Atlas A2训练系列产品支持), 且数据类型与updates,out一致,shape满足rank(data)>=1。支持非连续的Tensor,数据格式支持ND。
    • indices(const aclTensor*,计算输入):含义说明,公式中的indices,Device侧的aclTensor,数据类型支持INT32, INT64。indices.shape[-1] <= rank(data)。支持非连续的Tensor,数据格式支持ND。
    • updates(const aclTensor*,计算输入):含义说明,公式中的updates,Device侧的aclTensor,数据类型支持FLOAT16, FLOAT, BOOL, BFLOAT16(仅Atlas A2训练系列产品支持), 且数据类型与data,out一致。shape要求rank(updates)=rank(data)+rank(indices)-indices.shape[-1] -1。支持非连续的Tensor,数据格式支持ND。
    • out(const aclTensor*,计算输出):含义说明,公式中的output,Device侧的aclTensor,数据类型支持FLOAT16, FLOAT, BOOL, BFLOAT16(仅Atlas A2训练系列产品支持), 且数据类型与data,out一致,shape与data一致。支持非连续的Tensor,数据格式支持ND。 workspaceSize(uint64_t*,出参):返回用户需要在npu device侧申请的workspace大小。
    • executor(aclOpExecutor**,出参):返回op执行器,包含了算子计算流程。
  • 返回值: aclnnStatus:返回状态码,具体参见aclnn返回码。

    [object Object]

aclnnScatterNd

  • 参数说明:
    • workspace(void *, 入参): 在Device侧申请的workspace内存地址。
    • workspaceSize(uint64_t, 入参): 在Device侧申请的workspace大小,由第一段接口aclnnScatterNdGetWorkspaceSize获取。
    • executor(aclOpExecutor *, 入参): op执行器,包含了算子计算流程。
    • stream(const aclrtStream, 入参): 指定执行任务的 AscendCL Stream流。 (void *workspace, uint64_t workspaceSize, aclOpExecutor *executor, aclrtStream stream);`
  • 返回值: aclnnStatus:返回状态码,具体参见aclnn返回码。

约束与限制

调用示例

[object Object]