torch_npu.npu_quantize

功能描述

接口原型

npu_quantize(Tensor input, Tensor scales, Tensor? zero_points, ScalarType dtype, int axis=1, bool div_mode=True) -> Tensor

参数说明

输出说明

y:Device侧的aclTensor,公式中的输出,输出大小与input一致。

约束说明

支持的PyTorch版本

支持的型号

调用示例

import torch
import torch_npu
x = torch.randn(1, 1, 12).bfloat16().npu()
scale = torch.tensor([0.1] * 12).bfloat16().npu()
out = torch_npu.npu_quantize(x, scale, None, torch.qint8, -1, False)
print(out)