算子功能:MoE计算中,对输入x做Sigmoid或者SoftMax计算,对计算结果分组进行排序,最后根据分组排序的结果选取前k个专家。
计算公式:
Step 1: 归一化
根据normType 对输入x做归一化:
Step 2: 加偏置
若bias不为空,加偏置得到用于选择的值:
否则 。
Step 3: 分组筛选(仅groupCount > 1 时执行)
将normValue按groupCount分组,根据groupSelectMode计算每组得分:
选取得分最高的kGroup个组,将未选中组的对应位置置为 :
Step 4: Top-K专家选择
对normValue取Top-K得到专家索引,这里只需要expertIdxOut:
Step 5: Renorm与缩放
根据expertIdxOut从normOut中取出对应的k个专家得分:
normType=1 时做归一化;normType=0 时,renorm参数生效,renorm=1 时做renorm:
否则
最终输出:
Step 6: 可选输出
若outFlag为True,第三个输出为normOut;否则为空。
每个算子分为两段式接口,必须先调用“aclnnMoeGatingTopKGetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器,再调用“aclnnMoeGatingTopK”接口执行计算。
- 确定性计算:
- aclnnMoeGatingTopK默认确定性实现。
- 输入shape限制:
- x最后一维(即专家数)要求不大于2048。
- 输入值域限制:
- 要求1 <= k <= x_shape[-1] / groupCount * kGroup。
- 要求1 <= kGroup <= groupCount,并且kGroup * x_shape[-1] / groupCount的值要大于等于k。
- 要求groupCount > 0,x_shape[-1]能够被groupCount整除且整除后的结果大于groupSelectMode,并且整除的结果按照32个数对齐后乘groupCount的结果不大于2048。
- 其他限制:
- groupSelectMode取值0和1,0表示使用最大值对group进行排序, 1表示使用topk2的sum值对group进行排序。
- normType取值0和1,0表示使用Softmax函数,1表示使用Sigmoid函数。
- normType取值为1时,renorm参数无效;normType取值为0时,renorm参数生效,renorm取值为0和1,0表示不做renorm,1表示做renorm。
- outFlag取值true和false,true表示输出,false表示不输出。