torch_npu.contrib.module.LinearA8W8Quant

该接口计划废弃,可以使用torch_npu.contrib.module.LinearQuant接口进行替换。

功能描述

LinearA8W8Quant是对torch_npu.npu_quant_matmul接口的封装类,完成A8W8量化算子的矩阵乘计算。

接口原型

1
torch_npu.contrib.module.LinearA8W8Quant(in_features, out_features, *, bias=True, offset=False, pertoken_scale=False, output_dtype=None)

参数说明

输入说明

x1(计算输入):Tensor类型,数据类型支持int8。数据格式支持ND,shape需要在2-6维范围。

变量说明

输出说明

一个Tensor类型的输出,代表量化matmul的计算结果:

约束说明

支持的型号

调用示例