昇腾社区首页
中文
注册
开发者
下载

aclnnWeightQuantBatchMatmul

该接口后续版本会废弃,请使用接口。

产品支持情况

[object Object]undefined

功能说明

  • 算子功能:伪量化用于对self * mat2(matmul/batchmatmul)中的mat2进行量化。
  • 计算公式:result=self@mat2+biasresult = self@mat2+bias

函数原型

每个算子分为,必须先调用“aclnnWeightQuantBatchMatmulGetWorkspaceSize”接口获取入参并根据计算流程计算所需workspace大小,再调用“aclnnWeightQuantBatchMatmul”接口执行计算。

[object Object]
[object Object]

aclnnWeightQuantBatchMatmulGetWorkspaceSize

  • 参数说明

    [object Object]
  • 返回值:

    aclnnStatus:返回状态码,具体参见

    第一段接口完成入参校验,出现以下场景时报错:

    [object Object]

aclnnWeightQuantBatchMatmul

  • 参数说明

    [object Object]
  • 返回值:

    aclnnStatus:返回状态码,具体参见

约束说明

  • 确定性说明:
    • [object Object]Atlas 训练系列产品[object Object]、[object Object]Atlas 推理系列产品[object Object]:aclnnWeightQuantBatchMatmul默认确定性实现。

调用示例

示例代码如下,仅供参考,具体编译和执行过程请参考

[object Object]