aclnnMoeTokenPermuteWithRoutingMap
产品支持情况
功能说明
接口功能:MoE的permute计算,将token和expert的标签作为routingMap传入,根据routingMap将tokens和可选probsOptional广播后排序
计算公式:
tokens_num 为routingMap的第0维大小,expert_num为routingMap的第1维大小 dropAndPad为
[object Object]时dropAndPad为
[object Object]时如果probs不是none
函数原型
每个算子分为,必须先调用“aclnnMoeTokenPermuteWithRoutingMapGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMoeTokenPermuteWithRoutingMap”接口执行计算。
[object Object]
[object Object]
aclnnMoeTokenPermuteWithRoutingMapGetWorkspaceSize
参数说明:
[object Object]返回值:
[object Object]:返回状态码,具体参见 [object Object]aclnn 返回码[object Object]。一段接口完成入参校验,出现以下场景时报错:
[object Object]
aclnnMoeTokenPermuteWithRoutingMap
约束说明
确定性计算:
- aclnnMoeTokenPermuteWithRoutingMap默认确定性实现。
tokens_num和experts_num要求小于
[object Object],pad模式为false时routingMap 中 每行为1或true的个数固定且小于[object Object]。
调用示例
[object Object]