aclnnMoeTokenPermuteGrad

产品支持情况

[object Object]undefined

接口说明

算子功能：的反向传播计算。
计算公式： $inputGrad = permutedOutputGrad.indexSelect(0, sortedIndices)$ $inputGrad = inputGrad.reshape(-1, topK, hiddenSize)$ $inputGrad = inputGrad.sum(dim = 1)$

函数原型

每个算子分为，必须先调用 “aclnnMoeTokenPermuteGradGetWorkspaceSize” 接口获取入参并根据计算流程计算所需workspace大小以及包含了算子计算流程的执行器，再调用 “aclnnMoeTokenPermuteGrad” 接口执行计算。

[object Object]

[object Object]

aclnnMoeTokenPermuteGradGetWorkspaceSize

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

第一段接口完成入参校验，出现以下场景时报错：
[object Object]

aclnnMoeTokenPermuteGrad

参数说明：
[object Object]
返回值：

返回aclnnStatus状态码，具体参见。

约束说明

确定性计算：
- aclnnMoeTokenPermuteGrad默认确定性实现。
[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：numTopk <= 512。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]