算子和算子的融合,先将updates在quantAxis轴上进行量化:quantScales对updates做缩放操作,quantZeroPoints做偏移。然后将量化后的updates中的值按指定的轴axis,根据索引张量indices逐个更新selfRef中对应位置的值。相比aclnnInplaceQuantScatter多了roundMode输入。
每个算子分为,必须先调用“aclnnInplaceQuantScatterV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnInplaceQuantScatterV2”接口执行计算。
[object Object]
[object Object]
确定性计算:
- aclnnInplaceQuantScatterV2默认确定性实现。
indices的维数只能是1维或者2维;如果是2维,其第2维的大小必须是2;不支持索引越界,索引越界不校验;indices映射的selfRef数据段不能重合,若重合则会因为多核并发原因导致多次执行结果不一样。
selfRef,indices,updates,quantScales,quantZeroPoints数据类型输入组合包括:
Atlas 350 加速卡:
[object Object]undefined
[object Object]