aclnnMoeTokenPermuteWithEpGrad

产品支持情况

[object Object]undefined

功能说明

接口功能：aclnnMoeTokenPermuteWithEp的反向传播计算。
计算公式：
- 首先计算tokenGradOut：
  - 当rangeOptional[0] <= sortedIndices[i] < rangeOptional[1]时：
    $tokenGradOut[i] = permutedTokensOutputGrad[sortedIndices[i]-rangeOptional[0]]$
  - 否则：
    $tokenGradOut[i] = 0$
- 接着计算：
  $tokenGradOut = tokenGradOut.reshape(-1, topK, hiddenSize)$ $tokenGradOut = tokenGradOut.sum(dim = 1)$

函数原型

每个算子分为，必须先调用 “aclnnMoeTokenPermuteWithEpGradGetWorkspaceSize” 接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用 “aclnnMoeTokenPermuteWithEpGrad” 接口执行计算。

[object Object]

[object Object]

aclnnMoeTokenPermuteWithEpGradGetWorkspaceSize

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

第一段接口完成入参校验，出现以下场景时报错：
[object Object]

aclnnMoeTokenPermuteWithEpGrad

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

约束说明

确定性计算：
- aclnnMoeTokenPermuteWithEpGrad默认确定性实现。
top_k <= 512。
不支持paddedMode为[object Object]。
当rangeOptional为空时，忽略permutedProbsOutputGradOptional和probsGradOut，执行逻辑回退到。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]