aclnnAlltoAllvQuantGroupedMatMul-Transformer类接口-算子接口（aclnn）-算子库-API参考-CANN社区版9.0.0开发文档-昇腾社区

[object Object][object Object][object Object]undefined

[object Object]

[object Object]

每个算子分为，必须先调用[object Object]接口获取入参并根据计算流程计算所需workspace大小，再调用[object Object]接口执行计算。

[object Object]

参数说明
[object Object]
- gmmXQuantMode、gmmWeightQuantMode、mmXQuantMode、mmWeightQuantMode的枚举值跟量化模式关系如下:
  - 0: 不量化
  - 1: pertensor
  - 2: perchannel
  - 3: pertoken
  - 4: pergroup
  - 5: perblock
  - 6: mx量化
  - 7: pertoken动态量化
返回值

返回aclnnStatus状态码，具体参见。

第一阶段接口完成入参校验，出现以下场景报错：
[object Object]

[object Object]

[object Object]

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

注意：由于量化接口仅支持Atlas 350 加速卡，以下示例基于该系列实现。

[object Object]