aclnnMoeTokenUnpermuteGrad
产品支持情况
功能说明
接口功能:aclnnMoeTokenUnpermute的反向传播。
计算公式:
probs非None:
probs为None:
函数原型
每个算子分为,必须先调用“aclnnMoeTokenUnpermuteGradGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMoeTokenUnpermuteGrad”接口执行计算。
[object Object]
[object Object]
aclnnMoeTokenUnpermuteGradGetWorkspaceSize
aclnnMoeTokenUnpermuteGrad
约束说明
- 确定性计算:
- aclnnMoeTokenUnpermuteGrad默认确定性实现。
- tokens_num表示输入的token数量,hidden_size表示词向量维度。
- 通过paddedMode区分以下两种模式:paddedMode等于true时,每个专家固定能够处理capacity个token。paddedMode等于false时,每个token固定被topK_num个专家处理。
- [object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]、[object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]:topK_num <= 512。
调用示例
[object Object]