AscendQuant

功能

对输入x进行量化操作,scale和offset的size需要是x的最后一维或1。

输入

x:输入Tensor,数据类型支持float16、float,数据格式支持ND。

属性

输出

y:输出Tensor,数据类型支持int8,数据格式支持ND。

约束与限制

Atlas 推理系列产品不支持scale、offset及输入x为bfloat16

支持的ONNX版本

Opset v8/v9/v10/v11/v12/v13/v14/v15/v16