aclnnMoeInitRoutingQuantV2-Transformer类接口-算子接口（aclnn）-算子库接口-API-CANN社区版9.0.0-beta.2开发文档-昇腾社区

[object Object]

[object Object][object Object]undefined

[object Object]

接口功能：该算子对应MoE（Mixture of Experts，混合专家模型）中的Routing计算，以算子的计算结果作为输入，并输出量化后的Routing矩阵expandedXOut等结果供后续计算使用。本接口针对做了如下功能变更，请根据实际情况选择合适的接口：
- 新增Drop模式，在该模式下输出内容会将每个专家需要处理的Token个数对齐为expertCapacity个，超过expertCapacity个的Token会被Drop，不足的会用0填充。
- 新增Dropless模式下expertTokensCountOrCumsumOut可选输出，输出每个专家需要处理的累积Token个数（Cumsum），或每个专家需要处理的Token数（Count）。
- 新增Drop模式下expertTokensBeforeCapacityOut可选输出，输出每个专家在Drop前应处理的Token个数。
- 删除rowIdx输入。
- 增加动态quant计算模式。
计算公式：

1.将输入shape为[NUM_ROWS, K]的expertIdx展平为一行做排序，其中NUM_ROWS为输入token个数，K为token选择的专家个数，得出排序后的结果sortedExpertIdx和对应的序号sortedRowIdx：
$sortedExpertIdx, sortedRowIdx=keyValueSort(\text{flatten}(expertIdx))$
2.以sortedRowIdx做位置映射得出expandedRowIdxOut：
$expandedRowIdxOut[sortedRowIdx[i]]=i$
3.在dropless模式下，对sortedExpertIdx的每个专家统计直方图结果，再进行Cumsum，得出expertTokensCountOrCumsumOutOptional：
$expertTokensCountOrCumsumOutOptional[i]=Cumsum(Histogram(sortedExpertIdx))$
4.在drop模式下，对sortedExpertIdx的每个专家统计直方图结果，得出expertTokensBeforeCapacityOutOptional：
$expertTokensBeforeCapacityOutOptional[i]=Histogram(sortedExpertIdx)$
5.计算quant结果：
- 静态quant：
  $quantResult = round((x * scaleOptional) + offsetOptional)$
- 动态quant：
  - 若不输入scale：
    $dynamicQuantScaleOutOptional = row\_max(abs(x)) / 127$ $quantResult = round(x / dynamicQuantScaleOutOptional)$
  - 若输入scale:
    $dynamicQuantScaleOutOptional = row\_max(abs(x * scaleOptional)) / 127$ $quantResult = round(x * scaleOptional / dynamicQuantScaleOutOptional)$
6.根据quantResult得出expandedXOut：
$expandedXOut[expandedRowIdxOut[i]]=quantResult[i // K]$

[object Object]

每个算子分为，必须先调用“aclnnMoeInitRoutingQuantV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnMoeInitRoutingQuantV2”接口执行计算。

[object Object]

参数说明：
[object Object]
返回值：

[object Object]：返回状态码，具体参见 [object Object]aclnn 返回码[object Object]。

一段接口完成入参校验，出现以下场景时报错：
[object Object]

[object Object]

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

[object Object]

确定性计算：
- aclnnMoeInitRoutingQuantV2默认确定性实现。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]