aclnnMoeGatingTopKSoftmaxV2
产品支持情况
功能说明
- 接口功能:MoE计算中,如果renorm=0,先对x的输出做Softmax计算,再取topK操作;如果renorm=1,先对x的输出做topK操作,再进行Softmax操作。其中yOut为softmax的topK结果;expertIdxOut为topK的值的索引结果,即对应的专家序号;如果对应的行finished为True,则专家序号直接填num_expert值(即x的最后一个轴大小)。
- 计算公式:
renorm = 0,
renorm = 1
函数原型
每个算子分为,必须先调用“aclnnMoeGatingTopKSoftmaxV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMoeGatingTopKSoftmaxV2”接口执行计算。
[object Object]
[object Object]
aclnnMoeGatingTopKSoftmaxV2GetWorkspaceSize
aclnnMoeGatingTopKSoftmax
约束说明
- 确定性计算:
- aclnnMoeGatingTopKSoftmaxV2默认确定性实现。
调用示例
[object Object]