torch_npu.dequant_swiglu_quant

功能描述

接口原型

torch_npu.npu_dequant_swiglu_quant(Tensor x, *, Tensor? weight_scale=None, Tensor? activation_scale=None, Tensor? bias=None, Tensor? quant_scale=None, Tensor? quant_offset=None, Tensor? group_index=None, bool activate_left=False, int quant_mode=0) -> (Tensor, Tensor)

参数说明

Tensor中shape使用的变量说明:

  • TokensNum:表示传输的Tokens数,取值≥0。
  • H:表示嵌入向量的长度,取值>0。
  • groupNum:表示group_index输入的长度,取值>0。

输出说明

约束说明

支持的型号

调用示例