aclnnMoeTokenPermuteGrad-Transformer类接口-算子接口（aclnn）-算子库接口-API-CANN社区版9.0.0-beta.2开发文档-昇腾社区

[object Object]

[object Object][object Object]undefined

[object Object]

算子功能：的反向传播计算。
计算公式： $inputGrad = permutedOutputGrad.indexSelect(0, sortedIndices)$ $inputGrad = inputGrad.reshape(-1, topK, hiddenSize)$ $inputGrad = inputGrad.sum(dim = 1)$

[object Object]

每个算子分为，必须先调用 “aclnnMoeTokenPermuteGradGetWorkspaceSize” 接口获取入参并根据计算流程计算所需workspace大小以及包含了算子计算流程的执行器，再调用 “aclnnMoeTokenPermuteGrad” 接口执行计算。

[object Object]

[object Object]

[object Object]

确定性计算：
- aclnnMoeTokenPermuteGrad默认确定性实现。
[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]：numTopk <= 512。
Atlas 350 加速卡：在调用本接口时，框架内部会转调用接口，如果出现参数错误提示，请参考以下参数映射关系：
- permutedOutputGrad输入等同于aclnnMoeInitRoutingV2Grad接口的gradExpandedX输入。
- sortedIndices输入等同于aclnnMoeInitRoutingV2Grad接口的expandedRowIdx输入。
- numTopk输入等同于aclnnMoeInitRoutingV2Grad接口的topK输入。
- paddedMode输入等同于aclnnMoeInitRoutingV2Grad接口的dropPadMode输入。
- out输出等同于aclnnMoeInitRoutingV2Grad接口的out输出。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]