torch_npu.npu_group_quant

功能描述

接口原型

torch_npu.npu_group_quant(Tensor x, Tensor scale, Tensor group_index, *, Tensor? offset=None, ScalarType? dst_dtype=None) -> Tensor

参数说明

输出说明

一个Tensor类型的输出,代表group_quant的计算结果。如果参数dst_dtype为torch.int8,输出大小与输入x的大小一致。如果参数dst_dtype为torch.quint4x2,输出的数据类型是torch.int32,Shape的第0维大小与输入x的第0维大小一致,最后一维是输入x的最后一维的1/8。

约束说明

支持的型号

调用示例