将tensor updates中的值按指定的轴axis和索引indices逐个更新tensor data中的值。该算子为自定义算子语义,无对应的tensorflow或pytorch接口。
示例: 该算子有3个输入和一个属性:data,updates,indices和axis,其中data是待更新的tensor,updates是存储更新数据的tensor,indices表示更新位置,axis是指定的更新维度。当indices为1维,存在以下两种场景:
场景一: indices为1维,axis指定更新的维度shape为1,indices指定的是每个batch维度(最高维)在axis维度的偏移。
[object Object][object Object]场景二: indices为1维,axis指定更新的维度shape大于1,indices指定的是每个batch维度(最高维)在axis维度的偏移。
[object Object][object Object]
每个算子分为,必须先调用“aclnnInplaceScatterUpdateGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnInplaceScatterUpdate”接口执行计算。
参数说明
[object Object]- [object Object]Atlas 训练系列产品[object Object]:数据类型不支持UINT8、BFLOAT16。
- Atlas 350 加速卡:FLOAT8_E4M3FN、FLOAT8_E5M2、FLOAT8_E8M0、HIFLOAT8等数据类型仅在该型号支持。
返回值
第一段接口完成入参校验,出现以下场景时报错:
[object Object]
确定性计算:
- aclnnInplaceScatterUpdate默认确定性实现。
updates shape的0轴与indices shape的0轴一致。
indices为0维时,updates shape的0轴为1。
updates shape的0轴小于等于data shape的0轴。
updates与data的shape,除axis轴和0轴以外,其余轴的shape均相同。
当indices shape为二维时,shape的1轴需要等于2。
indices数据类型为INT32时,DtypeSize=4,为INT64时,DtypeSize=8,IndicesShapeSize为indices的shape乘积,需要使用的ub = IndicesShapeSize * DtypeSize + 224,当ub大于对应可以获取到的AI处理器版本总ub大小时,不支持。
当indices有重复时,重复位置的结果不保证。