昇腾社区首页
中文
注册

AscendQuant

功能

对输入x进行量化操作,scale和offset的size需要是x的最后一维或1。

输入

x:输入Tensor,数据类型支持float16、float,数据格式支持ND。

属性

  • offset,数据类型:float。
  • scale,数据类型:float。
  • sqrt_mode,数据类型:bool。
  • round_mode,数据类型:string。

输出

y:输出Tensor,数据类型支持int8,数据格式支持ND。

约束与限制

Atlas 推理系列产品 不支持scale、offset及输入x为bfloat16

支持的ONNX版本

Opset v8/v9/v10/v11/v12/v13/v14/v15/v16/v17/v18/v19/v20/v21/v22