须知:该接口后续版本会废弃,请使用最新aclnnWeightQuantBatchMatmulV3接口。
- 接口功能:伪量化用于对self * mat2(matmul/batchmatmul)中的mat2进行量化。
- 计算公式:
- ,必须先调用 aclnnWeightQuantBatchMatmulGetWorkspaceSize 接口获取入参并根据计算流程计算所需workspace大小,再调用 aclnnWeightQuantBatchMatmul 接口执行计算。
[object Object]
[object Object]
- 确定性说明:
- [object Object]Atlas A3 训练系列产品/Atlas A3 推理系列产品[object Object]、[object Object]Atlas A2 训练系列产品/Atlas A2 推理系列产品[object Object]:aclnnWeightQuantBatchMatmul默认确定性实现。
[object Object]