aclnnMoeComputeExpertTokens
产品支持情况
功能说明
- 接口功能:MoE计算中,通过二分查找的方式查找每个专家处理的最后一行的位置。
- 计算公式:
函数原型
每个算子分为,必须先调用“aclnnMoeComputeExpertTokensGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMoeComputeExpertTokens”接口执行计算。
[object Object]
[object Object]
aclnnMoeComputeExpertTokensGetWorkspaceSize
aclnnMoeComputeExpertTokens
约束说明
确定性计算:
- aclnnMoeComputeExpertTokens默认确定性实现。
输入shape大小不要超过device可分配的内存上限,否则会导致异常终止。
调用示例
[object Object]