aclnnTransposeQuantBatchMatMul-NN类接口-算子接口（aclnn）-算子库接口-API-CANN社区版9.0.0-beta.2开发文档-昇腾社区

[object Object]

[object Object][object Object]undefined

[object Object]

接口功能：完成张量x1与张量x2量化的矩阵乘计算，支持K-C。仅支持三维的Tensor传入。Tensor支持转置，转置序列根据传入的数列进行变更。permX1代表张量x1的转置序列，permX2代表张量x2的转置序列，序列值为0的是batch维度，其余两个维度做矩阵乘法。
示例：假设x1的shape是(M, B, K)，x2的shape是(B, K, N)，x1Scale和x2Scale不为None，batchSplitFactor等于1时，计算输出out的shape是(M, B, N)。

[object Object]

每个算子分为，必须先调用“aclnnTransposeQuantBatchMatMulGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小，再调用“aclnnTransposeQuantBatchMatMul”接口执行计算。

[object Object]

[object Object]

[object Object]

确定性说明： aclnnTransposeQuantBatchMatMul默认确定性实现。
Atlas 350 加速卡：
- permX1和permY支持[1, 0, 2], permX2支持输入[0, 1, 2]。
- x1Scale和x2Scale为1维，并且x1Scale为(M,), x2Scale为(N,)。
- out和dtype支持float16和bfloat16。

[object Object]

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]