aclnnIndexPutImpl
产品支持情况
功能说明
接口功能:根据索引 indices 将输入 self 对应坐标的数据与输入 values 进行替换或累加。
计算公式:
accumulate = False:
accumulate = True:
函数原型
每个算子分为,必须先调用“aclnnIndexPutImplGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnIndexPutImpl”接口执行计算。
[object Object]
[object Object]
aclnnIndexPutImplGetWorkspaceSize
参数说明
[object Object]- [object Object]Atlas 训练系列产品[object Object]:数据类型不支持BFLOAT。
返回值
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnIndexPutImpl
约束说明
确定性计算:
- aclnnIndexPutImpl默认非确定性实现,支持通过aclrtCtxSetSysParamOpt开启确定性。
输入参数selfRef, indices, values一般有以下约束:
- indices中的Tensor个数不能超过selfRef的维度。
- values的维度需满足以下公式或广播后满足以下公式:
- values.Dims() = indices[i].Dims() + (selfRef.Dims() - indices.size())
- 其意义是values前一半维度需要与indices中的Tensor维度相同(indices中的Tensor会广播成相同shape),后一半维度需要与selfRef维度扣除indices中Tensor个数后相同。
调用示例
[object Object]