aclnnBatchMatmulQuant

产品支持情况

[object Object]undefined

功能说明

接口功能：实现输入Tensor的dtype是float16, 输出的dtype是int8的矩阵乘计算
计算公式：
$out = Quant(x1@x2 + bias)$

函数原型

每个算子分为，必须先调用“aclnnBatchMatmulQuantGetWorkspaceSize”接口获取入参并根据流程计算所需workspace大小，再调用“aclnnBatchMatmulQuant”接口执行计算。

[object Object]

[object Object]

aclnnBatchMatmulQuantGetWorkspaceSize

参数说明：
[object Object]
返回值：

aclnnStatus：返回状态码，具体参见。

第一段接口完成入参校验，出现以下场景时报错：
[object Object]

aclnnBatchMatmulQuant

参数说明：
[object Object]
返回值：

aclnnStatus: 返回状态码，具体参见。

约束说明

确定性说明：
- [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]：aclnnBatchMatmulQuant默认确定性实现。

调用示例

示例代码如下，仅供参考，具体编译和执行过程请参考。

[object Object]