aclnnMoeInitRoutingQuantV2

产品支持情况

[object Object]undefined

接口功能：该算子对应MoE（Mixture of Experts，混合专家模型）中的Routing计算，以算子的计算结果作为输入，并输出量化后的Routing矩阵expandedXOut等结果供后续计算使用。

本接口针对做了如下功能变更，请根据实际情况选择合适的接口：

[object Object]

计算公式：

1.将输入shape为[numRows, k]的expertIdx展平为一行做排序，得出排序后的结果sortedExpertIdx和对应的序号sortedRowIdx，其中numRows为token个数，k为专家个数：
$sortedExpertIdx, sortedRowIdx=keyValueSort(\text{flatten}(expertIdx))$
2.以sortedRowIdx做位置映射得出expandedRowIdxOut：
$expandedRowIdxOut[sortedRowIdx[i]]=i$
3.在dropless模式下，对sortedExpertIdx的每个专家统计直方图结果，再进行Cumsum，得出expertTokensCountOrCumsumOutOptional：
$expertTokensCountOrCumsumOutOptional[i]=Cumsum(Histogram(sortedExpertIdx))$
4.在drop模式下，对sortedExpertIdx的每个专家统计直方图结果，得出expertTokensBeforeCapacityOutOptional：
$expertTokensBeforeCapacityOutOptional[i]=Histogram(sortedExpertIdx)$
5.计算quant结果：
- 静态quant：
  $quantResult = round((x * scaleOptional) + offsetOptional)$
- 动态quant：
  - 若不输入scale：
    $dynamicQuantScaleOutOptional = row\_max(abs(x)) / 127$ $quantResult = round(x / dynamicQuantScaleOutOptional)$
  - 若输入scale:
    $dynamicQuantScaleOutOptional = row\_max(abs(x * scaleOptional)) / 127$ $quantResult = round(x * scaleOptional / dynamicQuantScaleOutOptional)$

6.根据quantResult得出expandedXOut：

expandedXOut[i]=quantResult[sortedRowIdx[i]\%k]

每个算子分为，必须先调用“aclnnMoeInitRoutingQuantV2GetWorkspaceSize”接口获取计算所需workspace大小以及包含了算子计算流程的执行器，再调用“aclnnMoeInitRoutingQuantV2”接口执行计算。

[object Object]

参数说明：
[object Object]
返回值：

[object Object]：返回状态码，具体参见 [object Object]aclnn 返回码[object Object]。

一段接口完成入参校验，出现以下场景时报错：
[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]