torch_npu.npu_grouped_matmul

功能描述

接口原型

npu_grouped_matmul(x, weight, *, bias=None, scale=None, offset=None, antiquant_scale=None, antiquant_offset=None, per_token_scale=None, group_list=None, activation_input=None, activation_quant_scale=None, activation_quant_offset=None, split_item=0, group_type=-1, group_list_type=0, act_type=0, output_dtype=None) -> List[torch.Tensor]

参数说明

返回值

List[torch.Tensor]:
  • 当split_item为0或1时,返回的张量数量与weight相同。
  • 当split_item为2或3时,返回的张量数量为1。

约束说明

支持的型号

调用示例